预览加载中,请您耐心等待几秒...
1/4
2/4
3/4
4/4

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第27卷第2期计算机应用与软件Vol.27No.2 2010年2月ComputerApplicationsandSoftwareFeb.2010 个人信息检索概述 吉向文张世永 (复旦大学计算机科学技术学院复旦大学网络与信息工程中心上海200433) 摘要个人数字信息检索技术随着搜索技术的发展而蓬勃兴起,满足了人们对存储在个人电脑中的数据信息的检索需要。讨 论了个人信息检索技术的历史、现状,比较了现有的桌面搜索产品,总结了个人信息技术面对的主要问题。在参考其他个人信息检 索研究的基础上,针对未开放格式文件的检索问题,提出了个人信息检索模型的改进。 关键词个人信息检索桌面搜索统一数据接口 ASURVEYONPERSONALINFORMATIONRETRIEVAL JiXiangwenZhangShiyong (SchoolofComputerScience,NetworkinganDInformationEngineeringCenter,FuDanUniversity,Shanghai200433,China) AbstractWiththedevelopmentofsearchingtechnology,personalinformationretrievalboomsup,thishasmetthepeople’srequirement ofretrievingdatainformationstoredinpersonalcomputers.Inthispaperwegaveashortsurveytothehistoryandactualitiesofpersonalinfor- mationretrievaltechnologyandcomparedthecurrentdesktopsearchproducts,andsummarizedthemainproblemsthepersonalinformation technologyhas.Basedontakingother’sresearchinthisfieldasreference,weproposedanimprovementonpersonalinformationretrieval modeltosolvetheissueofretrievingdocumentswithunrevealedformat. KeywordsPersonalinformationretrievalDesktopsearchUnifiedDataInterface 样的搜索功能运行速度慢,而且只能搜索少量的文件。 0引言后来多媒体信息文件,以及类似提供了元数据的文件出现 了,要求文件搜索能够提供对元数据的搜索。这样进一步加剧 随着计算机和信息技术的发展,个人电脑里存储的信息越了文件搜索的负担。 来越庞大,即使是拥有良好整理习惯的人,也无法理清成百上千文件索引的建立,使得文件搜索速度得到提高。文件索引, Gigabytes的数据资料,很可能忘记将一些数据和信息存放在何包括了文件内容和元数据。在进行文件搜索的时候,是对索引 处。还有越来越多的人发现,自己整理了大量工作和学习资料,进行的搜索,而不是对文件系统进行搜索。 却很少查看资料中具体有哪些内容,当需要的时候,他希望能从数据信息日益庞大,也促使人们使用数据挖掘的方法从大 这些资料找到合适的信息和数据,但是,因为信息量太庞大,他量非组织的数据中查找相关的信息。个人信息管理系统的出 无法直接观察,并筛选出需要的资料。现,利用数据库和索引为人们提供了管理个人信息的工具。 个人数字信息检索技术应运而生。人们可以通过个人信息信息检索走过了从文件搜索,到Web搜索,到利用索引的 检索,在个人电脑里找到需要的信息与所需信息文件的准确位桌面搜索的过程[10]。 置本文回顾了个人信息检索技术的历史发展主要特点和问 。、1.2个人信息检索的特点 题,讨论了相关个人信息技术的研究,还对个人检索技术主要产 个人信息检索的最大特点是,用户对他们所存储数据信息 品———桌面搜索工具进行了调研。并针对统一检索模型,提出 的细节和特点比较熟悉,因而能提供记忆信息,利用广泛和多变 了优化的方案。 的上下文联系和线索来进行检索[4-6]。而Web搜索则通过关 键字来简化和加速对大量网页信息的检索。这也是Web搜索 1简单介绍 和个人信息检索最大的不同之处。 用户可以通过关键字来检索个人信息,更多时候可以通过 1.1历史与背景 信息的property-value来过滤和查找有用的信息,这样的proper- 个人电脑里存储的信息,有数据文件文字文档电子邮件 、、、ty-value称为元数据。用来检索的上下文联系和线索也可能与 多媒体文件等类型,而随着