预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110083709A(43)申请公布日2019.08.02(21)申请号201910349787.5(22)申请日2019.04.28(71)申请人宁波深擎信息科技有限公司地址315000浙江省宁波市镇海区福业街55号4楼315200申请人上海深擎信息科技有限公司(72)发明人柴志伟谢珉(74)专利代理机构北京酷爱智慧知识产权代理有限公司11514代理人向霞(51)Int.Cl.G06F16/36(2019.01)G06F16/31(2019.01)权利要求书2页说明书6页附图4页(54)发明名称一种基于描述定义的知识图谱自动构建方法及系统(57)摘要本发明公开了一种基于描述定义的知识图谱自动构建方法及系统,包括:定义领域知识描述文件,及对应的数据映射描述文件;基于所述领域知识描述文件生成以RDF三元组表示的知识体系,并将所述知识体系保存至三元组存储数据库中;基于所述数据映射描述文件将指定数据源的数据自动提取成知识实例,并将所述知识实例以属性图的形式保存至图数据库中;构建知识概念至所述知识实体的三元组,并将其存储至所述知识体系中。本发明生成的知识图谱,即保留三元组的语义及逻辑推理的能力又可以利用属性图数据库高效的图计算能力,对知识图谱的进一步应用打下坚实基础。CN110083709ACN110083709A权利要求书1/2页1.一种基于描述定义的知识图谱自动构建方法,其特征在于,包括:定义领域知识描述文件,及对应的数据映射描述文件;基于所述领域知识描述文件生成以RDF三元组表示的知识体系,并将所述知识体系保存至三元组存储数据库中;基于所述数据映射描述文件将指定数据源的数据自动提取成知识实例,并将所述知识实例以属性图的形式保存至图数据库中;构建知识概念至所述知识实体的三元组,并将其存储至所述知识体系中。2.如权利要求1所述的方法,其特征在于,所述领域知识描述文件的定义过程包括:获取用户通过可视化编辑器输入的领域知识描述,生成领域知识描述定义文件;将所述领域知识描述定义文件提交至后台进行校验,并接收返回的校验结果;若校验结果为通过校验,则将所述用户输入的领域知识描述保存至相应领域知识描述文件中;否则向用户返回错误提示信息。3.如权利要求2所述的方法,其特征在于,所述数据映射描述文件的定义过程包括:获取所述领域知识描述文件;选取数据源,载入所述数据源的数据字典;获取用户通过可视化编辑器建立的所述数据源至所述领域知识描述文件的数据映射关系;生成相应的数据映射描述文件,并将其提交至后台进行保存。4.如权利要求3所述的方法,其特征在于,所述领域知识描述文件与所述数据映射描述文件均采用标准的JSON或YAML文件形式进行定义。5.如权利要求4所述的方法,其特征在于,每个领域知识描述文件描述相关领域内任一子领域的知识,并用文件名称作为唯一标识;多个相关的领域知识描述文件通过文件名称相互引用其内部的知识。6.一种基于描述定义的知识图谱自动构建系统,其特征在于,包括:文件定义模块,用于定义领域知识描述文件,及对应的数据映射描述文件;知识体系生成模块,用于基于所述领域知识描述文件生成以RDF三元组表示的知识体系,并将所述知识体系保存至三元组存储数据库中;知识实例生成模块,用于基于所述数据映射描述文件将指定数据源的数据自动提取成知识实例,并将所述知识实例以属性图的形式保存至图数据库中;知识图谱构建模块,用于构建知识概念至所述知识实体的三元组,并将其存储至所述知识体系中。7.如权利要求6所述的系统,其特征在于,所述领域知识描述文件的定义过程包括:获取用户通过可视化编辑器输入的领域知识描述,生成领域知识描述定义文件;将所述领域知识描述定义文件提交至后台进行校验,并接收返回的校验结果;若校验结果为通过校验,则将所述用户输入的领域知识描述保存至相应领域知识描述文件中;否则向用户返回错误提示信息。8.如权利要求7所述的系统,其特征在于,所述数据映射描述文件的定义过程包括:获取所述领域知识描述文件;选取数据源,载入所述数据源的数据字典;2CN110083709A权利要求书2/2页获取用户通过可视化编辑器建立的所述数据源至所述领域知识描述文件的数据映射关系;生成相应的数据映射描述文件,并将其提交至后台进行保存。9.如权利要求8所述的系统,其特征在于,所述领域知识描述文件与所述数据映射描述文件均采用标准的JSON或YAML文件形式进行定义。10.如权利要求9所述的系统,其特征在于,每个领域知识描述文件描述相关领域内任一子领域的知识,并用文件名称作为唯一标识;多个相关的领域知识描述文件通过文件名称相互引用其内部的知识。3CN110083709A说明书1/6页一种基于描述定义的知识图谱自动构建