预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共32页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114153987A(43)申请公布日2022.03.08(21)申请号202111440843.X(22)申请日2021.11.30(71)申请人湖南大学地址410082湖南省长沙市岳麓区麓山南路麓山门(72)发明人李友焕石沛凡袁知秋(74)专利代理机构深圳市中原力和专利商标事务所(普通合伙)44289代理人胡国良(51)Int.Cl.G06F16/36(2019.01)G06F16/332(2019.01)权利要求书3页说明书15页附图13页(54)发明名称分布式知识图谱查询方法、装置及存储介质(57)摘要本申请提供一种分布式知识图谱查询方法及相关设备,可以提高针对分布式知识图谱查询的查询效率。该方法包括:第一设备获取用户输入的目标查询语句;第一设备对目标查询语句进行处理,得到目标查询图;第一设备对目标查询图进行线性分割,以得到N个查询子树;第一设备将N个查询子树分配至多个第二设备,以使得第二设备根据目标查询子树从数据库中进行检索过滤,以得到目标候选结果集,并根据目标候选结果集从第一设备所对应的多个第二设备中获取对应的匹配候选结果集,且将第一候选结果集与所述匹配候选结果集进行匹配,以得到配对结果,且返回配对结果;第一设备将多个第二设备中每个第二设备所对应的配对结果进行合并联接,得到最终结果集。CN114153987ACN114153987A权利要求书1/3页1.一种分布式知识图谱查询方法,其特征在于,包括:第一设备获取用户输入的目标查询语句;所述第一设备对所述目标查询语句进行处理,得到目标查询图;所述第一设备对所述目标查询图进行线性分割,以得到N个查询子树,其中,N为大于或等于2的整数;所述第一设备将所述N个查询子树分配至多个第二设备,以使得第二设备根据目标查询子树从数据库中进行检索过滤,以得到目标候选结果集,并根据所述目标候选结果集从所述第一设备所对应的多个第二设备中获取对应的匹配候选结果集,且将所述第一候选结果集与所述匹配候选结果集进行匹配,以得到配对结果,且返回所述配对结果,其中,所述第二设备为所述多个第二设备中的任一第二设备,所述目标查询子树为分配至所述第二设备的查询子树;所述第一设备将所述多个第二设备中每个第二设备所对应的配对结果进行合并联接,得到最终结果集。2.根据权利要求1所述的方法,其特征在于,所述第一设备对所述目标查询语句进行处理,得到目标查询图包括:所述第一设备通过MapReduce对所述目标查询语句进行处理,得到所述目标查询语句所对应的实体以及边;所述第一设备对所述目标查询语句所对应的实体进行编码,得到所述目标查询语句所对应实体的初始基础编码;所述第一设备根据所述目标查询语句所对应的边确定所述目标查询语句所对应实体的近邻拓扑编码;所述第一设备根据所述初始基础编码以及所述近邻拓扑编码构建所述目标查询图。3.根据权利要求2所述的方法,其特征在于,所述第一设备根据所述初始基础编码以及所述近邻拓扑编码构建所述目标查询图包括:步骤1、所述第一设备将随机从所述目标查询语句所对应实体中选取的K个实体确定为初始簇中心,其中,K为大于或等于2的整数;步骤2、所述第一设备根据所述K个实体中每个实体的初始基础编码以及所述每个实体的近邻拓扑编码对第i层进行聚类,得到Ki个簇中心,其中,i为大于或等于1的整数,且i小于所述目标查询图的层数;步骤3、所述第一设备将所述Ki个中心确定所述第i层的图顶点;步骤4、所述第一设备根据随机从所述第i层中选取的K(i+1)个顶点中每个顶点所对应实体的初始基础编码以及所述每个顶点所对应实体的近邻拓扑编码进行聚类,以得到所述目标查询图的第i+1层的K(i+1)个簇中心;步骤5、所述第一设备将所述K(i+1)个簇中心确定为所述第i+1层的图顶点;重复执行步骤4和步骤5,直至确定出所述目标查询图中所有层的图顶点为止。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:所述第一设备获取目标顶点所对应实体的初始基础编码,所述目标顶点为目标层中的任一簇,所述目标层为所述目标查询图中的任一层;所述第一设备对所述目标顶点所对应实体的初始基础编码进行或操作,以得到所述目2CN114153987A权利要求书2/3页标顶点的最终基础编码。5.根据权利要求1至4中任一项所述的方法,其特征在于,所述方法还包括:所述第一设备获取RDF数据集;所述第一设备对所述RDF数据集进行去重,得到目标RDF数据集。所述第一设备通过MapReduce对所述目标RDF数据集中每个RDF数据进行处理,得到所述每个RDF数据所对应的实体、边以及图标识;所述第一设备对所述每个RDF数据所对应的实体进行编码,得到所述每个RDF数据所对应实体的初始基础编码;所述第