预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

肖明邱小花黄界李国俊冯召辉:知识图谱工具比较研究 XiaoMing,QiuXiaohua,HuangJie,LiGuojun,FengZhaohui:ComparisonofSoftwareToolsforMappingKnowledgeDomain6611 知识图谱工具比较研究* 肖明邱小花黄界李国俊冯召辉 摘要介绍知识图谱分析一般工作流程,分析12种有代表性的知识图谱工具,从数据格式、数 据预处理、构建关系矩阵、数据标准化处理以及所支持的知识图谱分析方法5个方面对比12种软 件的差异,总结各种软件的优势和劣势,使用户能根据自身研究的需求,选择相应功能的知识图 谱软件工具。 关键词知识图谱软件工具比较研究知识图谱流程 ComparisonofSoftwareToolsforMappingKnowledgeDomain XiaoMing,QiuXiaohua,HuangJie,LiGuojun,FengZhaohui AbstractThisarticlefirstintroducesthegeneralworkflowofmappingknowledgedomain,andthen analyzestwelverepresentativeknowledgemappingtoolsintermsofdataformat,datapreprocessing, relationshipmatrixconstruction,stardardizationmeasuresandanalysismethodstheyenablerespectively.A summarywillbeprovidedintheend,describingthestrengthsandweaknessesofthesetools,soastohelp usersselectthebesttoolinaccordancewiththeirownresearchneeds. KeywordsMappingKnowledgeDomain,softwaretools,comparativestudy,MappingKnowledge DomainWorkflow 0引言掘研究、信息管理研究等领域来说,无异于锦 知识图谱(MappingKnowledgeDomain)是上添花,一图胜千言,在Web2.0、社交网络 指用可视化技术来发现、描述、分析以及最盛行以及大数据来临的时代,数据可视化领域 终展示数据或文本之间的相互关系。具体来也越来越受到各类研究者的关注。 说,知识图谱把统计学、应用数学、计算机科 学、信息科学、文献计量学等学科的理论和方1知识图谱分析流程 法相结合,再用可视化的方式来展现学科的发本文结合参考文献[2]中的流程,将知识图 展历程、研究现状、前沿领域以及整体知识框谱分析的流程归纳总结如图1所示: 架的多学科融合的一种研究方法[1]。知识图谱 的最大优点是一种利用空间形态来形象地表现 学科、领域、专业、个人文献或作者间相互关 系,旨在展示学术研究中的学科网络结构和变 化动态,通过引文分析、共作者分析、共现 分析等分析方法来发现学科内和子学科间的联图1知识图谱分析的流程 系,掌握当前学术研究的热点问题,预测学科 *本文得到国家社会科学基金项目“基于多方法融 的发展方向。 合的中外图书馆学情报学知识图谱实证研究”(编 在讲究海量数据挖掘的今天,将这些杂乱 号:11BTQ019)资助。本文得到中央高校基本科 无章的数据进行梳理,再通过一些可视化软件研业务费专项资金资助(项目编号:FRF-BR- 工具来形象的展示,对商业智能研究、数据挖13-016)。 ·新技术应用·图书馆杂志 6622LibraryJournal (a)数据检索:国内外常用的可以进行关系,为了获取更好的显示效果,更准确的数 知识图谱分析的数据源有:ISIWebofScience据分析结果,通常就要对数据进行缩减,选取 (WOS)、ScoPus(http://www.scopus.com)、Google一些典型的数据来分析,如:选取被引次数最 scholar[3](http://scholar.google.com)、NLM’s多的文章来分析,选择核心期刊上的数据,选 MEDLINE(http://www.ncbi.nlm.nih.gov/pubmed);择H指数较高的作者等;(5)选取前N个节点 这几个数据库有各自的特点和优势,收录数和边来分析,同时去掉孤立节点,对边进行 的文献也有一定的差异,另外还有其他的修剪,这样可以用更少量的数据来更强地表现 一些文献计量数据源:arXiv(http://arxiv.org),网络的重点。 CiteSeerX(http://citeseerx