预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115757824A(43)申请公布日2023.03.07(21)申请号202211411474.6(22)申请日2022.11.11(71)申请人上海交通大学地址200240上海市闵行区东川路800号(72)发明人张逸晗傅洛伊龙飞王新兵周成虎(74)专利代理机构上海汉声知识产权代理有限公司31236专利代理师胡晶(51)Int.Cl.G06F16/36(2019.01)G06F16/31(2019.01)G06F16/34(2019.01)权利要求书2页说明书16页附图3页(54)发明名称基于学术知识图谱的查询软件系统的构建方法及系统(57)摘要本发明提供了一种基于学术知识图谱的查询软件系统的构建方法及系统,包括如下步骤:设计RDF数据库的schema;根据设计好的schema,从数据库导出相应数据,存入RDF数据库Virtuoso中;设计文档数据库的schema;根据设计好的schema,从数据库导出论文的相关文档数据以及部分元信息,存入文档数据库ElasticSearch中;根据上述两个数据库互相配合提供的查询能力,构建后端查询模块;根据后端提供的接口,在前端完成相关功能的可视化展现。本发明显著降低了软件的开发成本及开发周期,系统架构简单明晰,使用过程快捷方便,适用范围较为广泛,可以为学术知识图谱的上层应用开发提供有效途径。CN115757824ACN115757824A权利要求书1/2页1.一种基于学术知识图谱的查询软件系统的构建方法,其特征在于,包括如下步骤:步骤1:设计RDF数据库的schema;步骤2:根据设计好的schema,从数据库导出相应数据,存入RDF数据库Virtuoso中;步骤3:设计文档数据库的schema;步骤4:根据设计好的schema,从数据库导出论文的相关文档数据以及部分元信息,存入文档数据库ElasticSearch中;步骤5:根据上述两个数据库互相配合提供的查询能力,构建后端查询模块;步骤6:根据后端提供的接口,在前端完成相关功能的可视化展现。2.根据权利要求1所述的基于学术知识图谱的查询软件系统的构建方法,其特征在于,所述步骤4中,从数据库导出论文的相关文档数据以及部分元信息包括:论文的摘要、论文的标题;所述步骤6中,在前端完成相关功能的可视化展现包括:论文聚合功能、内容查询功能。3.根据权利要求1所述的基于学术知识图谱的查询软件系统的构建方法,其特征在于,所述步骤1中,根据数据库已有的论文属性,构建出三元组的关联关系,结合需要查询的内容进行设计。4.根据权利要求1所述的基于学术知识图谱的查询软件系统的构建方法,其特征在于,所述步骤2包括如下步骤:步骤2.1:使用D2RQ工具,根据设计的schema生成并修改对应的ttl文件,ttl文件描述了schema中节点的属性,以及节点和节点之间的关系;步骤2.2:根据ttl文件,将数据库里的数据转化为.nt格式的RDF三元组文件;步骤2.3:使用docker,安装Virtuoso镜像;步骤2.4:启动Virtuoso镜像,启动时将上述的.nt文件挂载在Virtuoso初始化数据目录中,启动完毕后,使用sparql查询Virtuoso,检查数据是否导入成功。5.根据权利要求1所述的基于学术知识图谱的查询软件系统的构建方法,其特征在于,所述步骤3中,使用数据库的论文id关联论文的标题和摘要,以及部分需要高频查询的相关信息,构建ElasticSearch数据库所需的schema,结合需要查询的内容进行设计。6.根据权利要求1所述的基于学术知识图谱的查询软件系统的构建方法,其特征在于,所述步骤4中,在ElasticSearch中创建上述设计的schema,将数据按照schema格式导入ElasticSearch数据库。7.根据权利要求1所述的基于学术知识图谱的查询软件系统的构建方法,其特征在于,所述步骤5中,所述后端查询模块至少包含数据获取单元和数据缓存单元;所述数据获取单元通过上述两种数据库获取数据,在进行属性相关的查询或多对多关系的查询时使用Virtuoso数据库,在进行文档相关的查询时,使用ElasticSearch数据库;所述的数据缓存单元将上述数据缓存在内存中,用于模块的后续查找。8.一种基于学术知识图谱的查询软件系统的构建系统,其特征在于,包括如下模块:模块M1:设计RDF数据库的schema;模块M2:根据设计好的schema,从数据库导出相应数据,存入RDF数据库Virtuoso中;模块M3:设计文档数据库的schema;模块M4:根据设计好的schema,从数据库导出论文的相关文档数据以及部分元信息,存2CN115757824A权利要求书2/2页入文档数据库Elastic