预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共90页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第三章信息检索原理与技术23456789101112131415第一节信息检索基本原理广义: 信息检索指将信息按一定的方式组织和存储起来,并根据 信息用户的需要查找出有关信息的过程和技术。 InformationStorageandRetrieval信息检索基本原理的核心是用户信息需求与文献信息集合的比较和选择,是两者匹配(match)的过程。 一方面是用户的信息需求,一方面是组织有序的文献信息集合,检索就是从用户特定的信息需求出发,对特定的信息集合采用一定的方法、技术手段,根据一定的线索与规则从中找出(search,locate,hit)相关的信息。 信息检索的过程往往需要一个评价反馈途径,多次比较匹配,以获得最终的检索结果。其图示如下:检索点(accesspoint)是检索的出发点,常被称为“检索途径”(approach)。常用的检索途径有: 1)分类检索 2)主题检索 3)作者检索 4)名称检索 5)号码检索 1)分类检索(classification)2)主题检索3)作者检索4)名称检索5)号码检索其他检索点EI的检索实例1.5信息检索的类型29303132信息检索的类型计算机检索的优势信息检索的类型第二节信息检索数据库(工具)1、检索工具(数据库)的功能1)事实检索2)目录检索:3)文摘索引检索2、检索工具(数据库)的分类 (1)参考数据库(ReferenceDatabase) 此类数据库信息一般不自足,用户从中获取信息源信息后还需进一步去查找原文。 (2)源数据库(SourceDatabase,在欧洲也称数据银行:DataBank) 此类数据库数据自足,用户一般不必再查其他信息源,即可满足需求。 (3)混合数据库(MixedDatabase):此类数据库兼具上两类数据库特点,如多媒体数据库(MultimediaDatabase)等。 3、检索工具(数据库)的构成数据库与检索系统第三节计算机信息检索技术第三节计算机信息检索技术计算机检索的历史和现状计算机检索的历史和现状5152第三节计算机信息检索技术A.逻辑运算(布尔算符)A.逻辑运算(布尔算符)查询:2010AND世界杯ANDNOT小组赛课堂练习布尔检索的注意事项B.截词检索截词符 后截断,将截词符号放在一个字符串的右方,以表示其右的有限或无限个字符不影响该字符串的检索。例如: hyperthyr*可查到hyperthyre、hyperthyreosis、hyperthyroid、hyperthyroidosis、hyperthyroidism等。 hypertensi??可查到hypertension、hypertensive。 涉及到词的单复数、作者、年代、同根词等方面的检索时,选用后截断技术。前截断,将截词符号放在一个字符串的左方,以表示其左的有限或无限个字符不影响该字符串的检索。例如: *sighted,可查到farsighted与nearsighted。 前截断只检索后缀相同的一类词,常用于检索化学化工文献与复合词较多的文献。 中截断,将截词符号放在一个检索词的中间的一种截词方式。只允许有限截断,用于检索词的单复数或英美式不同拚法。例如: wom?n,可查到Woman,Women。 defen?e,可查到defense,defence。 C.位置检索C.位置检索C.位置检索D.检索字段控制D.检索字段控制作者=钱伟长and单位=清华大学and(题名=物理or摘要=物理)检索方式超文本式、超媒体检索菜单式检索命令式检索--专业检索方式第三节计算机信息检索技术3-1加权检索例如:W=计算机(1)情报检索(4)自动化(2) 3-1加权检索3-2自然语言检索3-2自然语言检索切分歧义新词识别3-3相关信息反馈检索3-3相关信息反馈检索3-4模糊检索3-5概念检索