预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共97页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

信息检索技术基础主要内容检索语言:在信息的存储和检索过程中,为使信息在用户和系统间有效传递,各种检索工具使用专门的语言体系来描述信息的内部特征和外部特征,同时要求用户依此构造检索提问式来进行信息检索,这种专门的语言体系成为检索语言。主题语言(内容特征) 按照主题性质的不同可分为: 标题词 单元词 叙词 关键词标题词语言:是表征文献内容特征的、经过规范化处理的名词术语(包括词和短语)。 例如:飞机:plane、airplane、aeroplaneaircraft 用aircraft来表示所有“飞机”概念,以此作为规范词.使用aircraft一词的检索结果将包括全部有飞机概念的文献. 单元词:指从信息内容中抽出的最基本的词汇。 关键词语言:关键词是从文题、文摘或正文中抽出,具有实质意义,能够代表文献内容主题的名词术语。关键词可直接用于文献标引。叙词语言EI(Thesaurus)作用 检索词用来组织信息(信息工作者) 对文献信息内容进行标引; 对内容相同或相关的信息加以集中或揭示其相关性; 对信息进行系统化、有序化; 检索词用于检索(检索用户) 进行主题检索 进行分类检索 进行外表特征检索 检索词是信息资源组织与检索者检索提问的桥梁,在数据库中,对应为检索点、检索入口对文献信息内容进行标引字段名2.2.1布尔逻辑 2.2.2截词检索 2.2.3限制检索 2.2.4位置逻辑 2.2.5检索策略式 在进行信息检索时,检索项之间概念有相交关系、同义关系或相关关系,这时采用布尔逻辑进行检索项之间的逻辑组配。 用“与”(AND)、“或”(OR)、“非”(NOT)来表达。 布尔逻辑检索:在进行信息检索时,检索项之间概念有相交关系、同义关系或相关关系,这时采用布尔逻辑进行检索项之间的逻辑组配。 布尔逻辑算符有三种: 逻辑与、逻辑或、逻辑非 用“与”(AND)、“或”(OR)、“非”(NOT)来表达。 逻辑“与”逻辑或逻辑“非”算符,是具有概念包含关系的一种组配,可以从原检索范围中排除某一内容。 表达形式:AnotB、A-B 具有缩小命中范围,提高查准率,增强检索的专指性,减少输出量的作用。 例:Energynotnuclear 布尔逻辑检索技术运用“布尔算符”的注意事项: 布尔逻辑运算符运算顺序为:not→and→or 运算符遵循数学运算法则; (a)括号优先;(AorB)andCnotD (b)在检索式中只有and或or前后的检索标识可 以交换; (c)检索式中有not时前后检索词不能交换。 备注:()必须在半角和英文状态下输入 布尔逻辑检索表达式的特点写出下图的布尔逻辑检索式截词(truncation):是指检索者将检索词在认为比较合适的地方截断,也称模糊检索,又称词干检索法 截词检索,用截断的词的一个局部进行的检索即利用检索词的词干加上截词符号去数据库中进行检索。(模糊检索) 截词符号:一般为“?”或“*”。各种检索系统有不同规定,没有统一标准。 截词符具有“OR”运算符的功能,能够扩大检索范围,而且减少了输入检索词的时间,节约了机时。截词的分类后截词,也称前方一致。它是将截词符放在一串字符的后面,用以表示以相同字符串开头,而结尾不同的所有词。 词尾的有限截断 相同字符串后可能变化一个字符时,则在其后使用一个“?”,常用来表示检索词的单复数变化。 例如用system?可以查出sytem和systems的文献。 相同字符串后可能变化两个以上字符时,则在其后连续使用若干个“?”代替可能变化的字符。例如,??表示两个字符,???表示三个字符,以此类推 如表示九十年代;199? 如表示20世纪:19??词尾的无限截断 相同字符串后可能变化任何字符串时,则在其后使用一个“?”或“*”。这种方法可以查找出含有相同字符串的所有检索词。 例如,comput*可查出compute,computer,computing,computation,computerisation等 如physic*可检出:physical,physic,physicalismphysician,physicists,physicochenistry,physics等. 即相当于为上述各检索词的逻辑OR运算中间截词:可变化的字符出现在单词的中间位置。 例如: “woman”和“women”,可用“wom?n”代替; “defence”和“defense”可用“defen?e”代替。 查找英美不同拼法最有效 前截断:将截词符号放在一个字符串的左方是后方一致的检索。 例如: *physics可检physics、astrophysics、biophysics…….. *Chem*可检chemical,electrochemic,chemistry,thermochemi