预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

什么知识仓库?知识仓库的目标?知识仓库的结构知识元 对某一知识的完整描述叫知识元,如概念、定理、定律、事实、历史人物、历史事件 相关知识元关联 知识元引用自动关联 通过知识元关联使知识仓库成为有机整体快速实现资源共享 提高资源开发利用层次 实现“沉浸式”学习与研究环境 加快资源开发速度 提高知识交流速度 元数据—描述数据的数据(strutureddataaboutdata) 主要元数据标准: CDWA(27),DC(15),EAD(TEI)(21),FGDC(460),GILS(22-43),TEI(20),VRA(17-38) 元数据描述的层次 很简单:传统搜索引擎 中间:DubinCore,15元素 复杂:Marc,FGDC国际接轨 简单和复杂兼顾 可扩展 以DulinCore为基础的面向对象的CNKI元数据方案 简单 扩展性好 应用适应性好 在文献对象描述上可以和DC较好的对应XML XML是eXtensibleMarkupLanguage(可扩展的置标语言)的缩写,是W3C组织发布的标准。W3C组织制定XML标准的初衷是,定义一种互联网上交换数据的标准。W3C采取了简化SGML的策略。不仅可以通过XML来创建标记语言,而且能够创建高度结构化的标记语言,其采用纯文本格式,具有很好的交换性,使其成为开展以内容为核心的 元数据应用的首选描述语言 DTD:DocumentTypeDefinition XMLSchema 支持多种数据类型RDF的数据模型可以用有向图描述: OraLassilaisthecreatoroftheresourcehttp://www.w3.org/Home/Lassila. 三元组(S(Subject),P(Predicate),O(Object)) Subject:http://www.w3.org/Home/Lassila Predicate:Creator Object:OraLassila 资源发现:提供更好的搜索引擎性能 智能代理软件:可以促进知识共享和交换的自动化 内容分级 知识产权 电子商务 协同工作传统资源开发模式 一种资源+一种软件的模式 CNKI知识仓库开发模式 软件资源分离模式 统一软件平台 各种知识库 优点 降低开发成本,缩短开发周期 提供集成服务,方便用户使用 提高服务品质对象管理系统知识仓库管理:面向对象的知识库管理系统 知识库创建,知识元创建 多种类型对象支持:文本,音频,视频等 传统检索 精确检索 智能全文检索 支持相关度排序,多语言扩展。 面向对象的检索 自然语言检索接口模式驱动的知识需求的描述—问题视图动态聚类 对查询结果进行动态划分 自动分类 对文本对象进行归类 概念关联分析 分析概念间的关联关系,如共现关系 自动标引 自动文摘 为文本对象产生文摘用户模式分析 分析用户在知识仓库中的行为模式 用户需求定制 用户提出自己的知识需求描述 内容推送服务 根据用户行为模式,以及用户定制的需求词典管理 汉语分词词典 自动分词 自动分词算法 自定义分词算法 主题词表管理 汉语主题词表 行业主题词表 多语言词典管理 中英自动翻译:单词,专业词汇,120万英汉字典支持目标:分布式异构数据库互连。提供集成知识服务 ANSI/NISOZ39.50 InformationRetrievalApplicationServiceDefinitionandProtocolSpecification OAI TheOpenArchivesInitiativeProtocolforMetadataHarvesting XML–Query OpenURL 感谢各位专家!