预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114491085A(43)申请公布日2022.05.13(21)申请号202210392590.1(22)申请日2022.04.15(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人易鹏(74)专利代理机构成都七星天知识产权代理有限公司51253专利代理师袁春晓(51)Int.Cl.G06F16/36(2019.01)G06F16/33(2019.01)G06F16/31(2019.01)权利要求书3页说明书11页附图7页(54)发明名称一种图数据存储方法和分布式图数据计算方法(57)摘要本说明书涉及数据处理领域,特别涉及一种图数据存储方法和分布式图数据计算方法。图数据包括节点和边,其中节点包括实体节点以及非实体节点;该图数据存储方法包括:基于图数据获取第一表和第二表;获取多个实体节点组各自对应的第一子表和第二子表;以及,将所述各实体节点组对应的第一子表和第二子表分发到多个计算单元以进行分布式存储。该分布式图数据计算方法中,所述图数据按照上述图数据存储方法分布式存储于多个计算单元上,可以由其中一个计算单元执行。CN114491085ACN114491085A权利要求书1/3页1.一种图数据存储方法,所述图数据包括节点和边,其中节点包括实体节点以及非实体节点;该方法包括:基于图数据获取第一表和第二表;其中,第一表包括各实体节点的记录,每条实体节点的记录包括与该实体节点关联的非实体节点的信息,第二表包括多个节点对的信息,每个节点对包括一个非实体节点以及与之关联的一个实体节点;获取多个实体节点组各自对应的第一子表和第二子表;其中,所述多个实体节点组为对各实体节点进行划分得到的多个分组;实体节点组对应的第一子表包括该实体节点组中各实体节点在所述第一表中对应的记录,其对应的第二子表包括所述第二表中包含该实体节点组中各实体节点的节点对的信息;将所述各实体节点组对应的第一子表和第二子表分发到多个计算单元以进行分布式存储。2.如权利要求1所述的方法,其中:同一个实体节点组对应的第一子表和第二子表存储于同一计算单元。3.如权利要求1所述的方法,其中,所述获取多个实体节点组各自对应的第一子表和第二子表,包括:将各实体节点等数量的划分到多个实体节点组;对于每个实体节点组:从所述第一表中提取该实体节点组中各实体节点对应的记录,得到该实体节点组对应的第一子表;从所述第二表中提取包含该实体节点组中各实体节点的节点对的信息,得到该实体节点组对应的第二子表。4.如权利要求1所述的方法,其中,所述获取多个实体节点组各自对应的第一子表和第二子表,包括:将第二表划分,得到多个第二子表;其中,包含同一实体节点的节点对的信息被划分到同一第二子表中;对于每个第二子表,从所述第一表中提取该第二子表对应的实体节点组中各实体节点对应的记录,得到对应的第一子表。5.如权利要求4所述的方法,其中,各第二子表包含的节点对的信息的数量均衡。6.如权利要求1所述的方法,第二子表中的节点对的信息按照非实体节点有序存储。7.如权利要求6所述的方法,第二子表中的节点对的信息按照非实体节点的类型分区存储,且在每个分区中节点对的信息按照非实体节点的名称或标识有序存储。8.如权利要求1所述的方法,所述节点对的信息包括其非实体节点和实体节点的名称或标识,以及两者之间的关系类型。9.一种图数据存储系统,所述图数据包括节点和边,其中节点包括实体节点以及非实体节点;该系统包括:表获取模块,用于基于图数据获取第一表和第二表;其中,第一表包括各实体节点的记录,每条实体节点的记录包括与该实体节点关联的非实体节点的信息,第二表包括多个节点对的信息,每个节点对包括一个非实体节点以及与之关联的一个实体节点;分组模块,用于获取多个实体节点组各自对应的第一子表和第二子表;其中,所述多个实体节点组为对各实体节点进行划分得到的多个分组;实体节点组对应的第一子表包括该实体节点组中各实体节点在所述第一表中对应的记录,其对应的第二子表包括所述第二表2CN114491085A权利要求书2/3页中包含该实体节点组中各实体节点的节点对的信息;分发模块,用于将所述各实体节点组对应的第一子表和第二子表分发到多个计算单元以进行分布式存储。10.一种图数据存储装置,包括至少一个存储介质和至少一个处理器,所述至少一个存储介质用于存储计算机指令;所述至少一个处理器用于执行所述计算机指令以实现如权利要求1‑8中任一项所述方法。11.一种分布式图数据计算方法,所述图数据按照如权利要求1‑8中任一项所述的方法分布式存储于多个计算单元上;该方法由其中一个计算单元执行,包括:从本地的第一子表中确定属于第一类型的第一起始