预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

您的论文得到两院院士关注软件时空 文章编号:1008-0570(2007)11-3-0237-02 基于本体的智能检索系统的研究 ResearchinIntelligentSearchSystemBasedonOntology (南京工业大学)张柳松 ZHANGLIUSONG 摘要:由于传统的搜索引擎是基于关键词的检索,检索结果无论是在召回率还是在精确度上都不能令人满意,然而基于本体 的智能检索系统是以概念语义为核心来实现信息检索,能改善传统的搜索引擎在语义理解方面的不足。 关键词:智能检索;本体;概念语义 中图分类号:TP391.3文献标识码:A Abstract:Manytraditionalsearchenginesarebasedonkeywords,theresultcannotbesatisfyingintheprecisionorintherecall. However,theintelligentsearchsystembasedonontologytakesthesemanticasthecoretocarryouttheinformationsearch,which canimprovetraditionalthesearchengineinthesemanticunderstanding. Keywords:Intelligentsearch,Ontology,semantic 技 1引言③系统和用户能进行某种程度的互操作,以满足用户查询 信息的需求。进行查询时,如果户对查询结果不满意时,可以要术 随着Internet的迅速发展,WWW已经成为世界上最大的求进行重新查询,直至获得用户满意的信息为止。 信息库。如何有效的从中获取有用的信息,已成为困惑我们的④支持对检索结果的多种排序方式,如按时间排序和按与创 一大问题。查询条件的相关程度排序。按相关程度排序是指通过某种相关 现有信息搜索技术可分为类主动式搜索基于技 3:,Push度计算方法,把最贴近用户需求的信息以较为显著的形式展新 术的信息获取以及搜索引擎方式。上述3种检索机制在最终实 现出来。 现上都基于关键词的全文匹配或是基于主题分类。虽然Google 搜索引擎在传统信息检索的基础上,增加了有关WWW文档的3智能检索系统的设计流程 超链接分析,取得了一定的效果,但从本质上看,仍然属于关键3.1对领域本体的构建 词检索的范畴并没有从根本上解决检索过程中语义信息缺乏 ,本体是由特定信息领域中的术语集合及术语之间的关 的问题。此类检索无论从召回率还是精确度上都不能令 系组成的,本体和本体之间的关系是由相关的领域专家建立 人满意。 的。本体可认为是语义丰富的元数据,它可获取存储数据的 本文介绍一种基于本体的以概念语义为核心的智能检 信息内容。在信息获取中,在本体和知识库之间建立某种映 索技术。 射关系,利用本体的特性使查找的信息内容更加清晰 2智能检索系统介绍有条理。 设计智能检索系统,首先要建立本体库。本体库是智能搜 智能检索是对传统检索的改进,在其信息检索过程中,引 索引擎的信息组织框架,在原始信息的收集、资源对象元数据 入对查询对象的概念语义信息的处理,通过自动查询扩展和语 的提取和信息检索都需要以领域本体为基本依据。 义分析等处理操作,提高信息检索算法的查准率和查全率,改 本体建立应该说可以分成自顶向下和自底向上两种,两者 善了信息检索系统的性能。 各有优势。但是似乎目前更多的做法是自顶向下的,就是先建 作为一个智能检索引擎,应该具有以下区别于传统检索系 顶层本体,再一步步扩展,直到能涵盖该领域为止。 统的功能: 在具体构建本体过程中,我们可以选择由美国Stanford大 ①具有一定的语义分析和推理、自动查询扩展等功能。能 学开发的本体编辑器。它也是基于知识的编辑器,是用 根据用户的查询条件进行相应的语义扩展和推理处理,以返回Protégé 开发的一个开源项目,是我现在能下到的最新 更多用户所关心的信息,提高系统的查全率和查准率。JavaProtégé3.2 版本。 ②仅面向某个专业领域,以提供关于该领域全面的、准确 在编辑器中,本体结构以树型的层次结构显示,用 的专业信息。因为构建本体是比较繁重的工作,只可能涉及某Protégé 户可以通过点击相应项来编辑或增加类、子类、属性、实例等本 一个专业领域,这样才能尽可能的包括该领域所有的概念及其 体元素,另外,用户可以不用考虑具体的本体描述语言,而在概 相互之间的关系。 念层次上设计领域本体模型。 张柳松:硕士研究生本人使用Protégé构建的“计算机”的本体框架(部分)如 《PLC技术应用200例》邮局订阅号:82-946360元/年-237- 软件时空中文核心期刊《微计算机信息》(管控一