预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共63页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第2章计算机信息检索技术1信息检索的基本概念信息存储和检索过程的基本原理计算机信息检索是对信息进行收集、分类、标引、著录,并加以有序化组织,将信息储存到计算机存储信息系统中,编制出一个信息检索系统或信息检索工具的过程。用户1.3信息检索的类型2检索系统2.1检索系统的功能模块2.1检索系统的功能模块2.2文档——记录——字段2.2文档——记录——字段3检索语言3.1检索语言的种类检索语言 的类型分类语言中国图书馆图书分类法中国图书馆图书分类法F27企业经济F29城市与市政经济F3农业经济F4工业经济F7贸易经济F72中国国内贸易经济F73世界各国国内贸易经济F74国际贸易F75各国对外贸易F8财政、金融F81财政、国家财政F82货币F83金融、银行F84保险 中国图书馆图书分类法图书馆的藏书都是按分类号排架的。分类号的排列采用由左至右逐位对比的方法进行排列,先比较字母部分,再比较数字部分。 ——字母部分按英文字母固有的次序排列。例: B2中国哲学 B3世界哲学 E27各种武装力量 E512苏联军事 TM92电气化、电能应用 TU201建筑设计原理 ——分类号中的阿拉伯数字依小数制排列。例: B021辩证唯物主义的物质论 B022辩证唯物主义的意识论 B022.2客观规律性与主观能动性 D035.37交通公安管理 D035.4监察、监督分类号的排列次序(续)读者实际利用图书馆时,往往需要知道书刊的分类号和索书号(又称索取号)。 索书号是图书馆赋予每一种馆藏图书的号码,是读者查找图书非常必要的代码信息。它的第一部分是分类号,第二部分是书次号。索书号的两部分之间有一个空格或一条斜线“/”。书次号或者是按照图书作者姓名所编排的著者号码,或者是按照图书进入馆藏时间的先后所取用的顺序号码。 ——不同的索书号确定排列先后顺序的步骤是,先比较分类号码;如分类号码相同再比较著者号码或顺序号码。分类号比较:先英文字母排,后阿拉伯数字按小数制排。分类号中“-”排在0之前,例如:先排F-43再排F0。分类号的数字排列比较采用对位比较法,字符序列以ASCII字符集为依据。比如:B11、B111、B112、B12,书次号的数字排列比较采用自然顺序排列方法,即1,2,3,...,9,10,11,...,99,100,101,…。 重新排列以下分类号的顺序主题语言主题语言主题语言代码语言自然语言3.2信息检索的途径3.2信息检索的途径4计算机检索技术常用的计算机检索技术布尔检索逻辑“与”逻辑“或”逻辑“非”截词检索后截断邻近检索(proximityretrieval),又称为“位置检索”、“词位检索”、“全文检索”是一种可以不依赖叙词表而直接使用自由词进行检索的一种技术,它以数据库原始记录中词语的相对次序或者位置关系为对象进行组配运算。(W)与(nW)算符(N)与(nN)算符(S)算符(F)算符字段限定检索例如: (minicomputer/DE,TIORpersonalcomputer/ID,TI)ANDPY=2008ANDLA=English 这个检索式所表达的检索要求是:查找2008年出版的关于微电脑或者个人电脑的英文文献,并要求“微电脑”一词在命中文献的叙词字段、标题字段出现,“个人电脑”一词在命中文献的自由词字段出现。 在互联网搜索引擎中,限定字段也是常用的语法。例如,“filetype:”表示在某种文件类型(如doc、pdf)中查找资料。详细的介绍请参见搜索引擎部分。5信息检索的基本步骤1分析检索课题2选择检索系统3确定检索词确定检索词确定检索词确定检索词确定检索词确定检索词4构造检索式(试验性检索)构造检索式(试验性检索)5调整检索策略(正式检索)调整检索策略(正式检索)调整检索策略(正式检索)2.当检索结果信息量太少时 原因:检索词拼写错误;遗漏重要的同义词或隐含概念;检索词过于冷僻具体;没有使用截词算符;位置算符和字段算符使用的过多;使用过多的“AND”算符。考虑扩大检索范围,方法如下: (1)根据词表的分类结构体系扩展关键的检索词,用“扩展”按钮增加同义词和相关词并用“OR”算符连接这些词; (2)降低检索词的专指度,可从词表或检出文献中选择上位词或泛指词补充到检索式中; (3)减少检索年限、文献类型、语种及出版国的限制,如增加回溯检索年限; (4)取消某些限制过严的字段限制、位置算符限制(或者改用限制程度较小的位置算符) (5)在词干相同的单词后使用截词符(?或*); (6)改精确检索为模糊检索; (7)同时使用拼写正确的词,以及拼写错误的词或存在多种普遍错别字的词作为检索词。调整检索策略(正式检索)调整检索策略(正式检索)6输出检索结果