预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共28页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114282073A(43)申请公布日2022.04.05(21)申请号202210197317.3(22)申请日2022.03.02(71)申请人支付宝(杭州)信息技术有限公司地址310013浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人张达(74)专利代理机构北京智信禾专利代理有限公司11637代理人吴肖肖(51)Int.Cl.G06F16/901(2019.01)G06F16/36(2019.01)权利要求书3页说明书17页附图7页(54)发明名称数据存储方法及装置、数据读取方法及装置(57)摘要本说明书实施例提供数据存储方法及装置、数据读取方法及装置,其中所述数据存储方法应用于知识图谱平台,包括:拆分目标知识图谱数据,确定至少两个待存储目标子图数据;其中,所述目标知识图谱数据包括目标实体节点以及至少一个与所述目标实体节点相关联的边,各个所述待存储目标子图数据包括所述目标实体节点以及至少一个目标属性的边;将所述至少两个待存储目标子图数据按照边的属性存储至至少两个连续数据块,其中,前一数据块中存储的待存储目标子图数据的末尾实体标识与后一数据块中存储的待存储目标子图数据的初始实体标识相同,可实现对数据量大的图谱数据完整地按顺序存储,且提高存储效率。CN114282073ACN114282073A权利要求书1/3页1.一种数据存储方法,应用于知识图谱平台,包括:拆分目标知识图谱数据,确定至少两个待存储目标子图数据;其中,所述目标知识图谱数据包括目标实体节点以及至少一个与所述目标实体节点相关联的边,各个所述待存储目标子图数据包括所述目标实体节点以及至少一个目标属性的边;将所述至少两个待存储目标子图数据按照边的属性存储至至少两个连续数据块,其中,前一数据块中存储的待存储目标子图数据的末尾实体标识与后一数据块中存储的待存储目标子图数据的初始实体标识相同。2.根据权利要求1所述的数据存储方法,所述将所述至少两个待存储目标子图数据按照边的属性存储至至少两个连续数据块之后,还包括:记录每个数据块的索引信息,并基于所述每个数据块中的索引信息,确定索引数组信息,其中,所述索引信息包括所述每个数据块中存储的待存储目标子图数据的初始实体标识、末尾实体标识、与末尾实体标识相关联的边属性条件。3.根据权利要求2所述的数据存储方法,所述基于所述每个数据块中的索引信息,确定索引数组信息,包括:确定每个数据块中待存储目标子图数据的初始实体标识、末尾实体标识;在确定两个连续数据块中相邻的末尾实体标识与初始实体标识相同的情况下,对所述两个连续数据块中的索引信息进行处理,确定索引数组信息,其中,所述索引数组信息中的实体标识基于存储顺序排列。4.根据权利要求1所述的数据存储方法,所述拆分所述目标知识图谱数据,确定至少两个待存储目标子图数据,包括:确定拆分参数,并基于所述拆分参数拆分所述目标知识图谱数据,确定至少两个待存储目标子图数据;相应地,所述拆分目标知识图谱数据之前,还包括:对接收到的待处理数据进行处理,确定所述待处理数据的目标实体数据、以及与所述目标实体数据相关联的关系数据;基于所述目标实体数据以及所述关系数据确定所述待处理数据的数据结构,并基于所述数据结构构建目标知识图谱数据。5.根据权利要求4所述的数据存储方法,所述将所述至少两个待存储目标子图数据按照边的属性存储至至少两个连续数据块,包括:确定所述待存储目标子图数据中边的方向,并基于所述边的方向对所述待存储目标子图数据中的边进行分类,确定至少一个边的类型,其中,所述边的方向包括出边方向和入边方向,所述出边方向为由目标实体节点指向其他实体节点的方向,所述入边方向为由其他实体节点指向目标实体节点的方向;基于所述至少一个边的类型将所述至少两个待存储目标子图数据存储至至少两个连续数据块。6.根据权利要求1所述的数据存储方法,所述数据块还包括缓冲区,相应地,所述将所述至少两个待存储目标子图数据按照边的属性存储至至少两个连续数据块,包括:2CN114282073A权利要求书2/3页在所述待存储目标子图数据中确定无法存储至至少两个连续数据块的剩余数据,将所述剩余数据存储至所述至少两个连续数据块的末尾数据块的缓冲区。7.一种数据读取方法,应用于知识图谱平台,包括:接收针对目标数据的数据读取请求,基于所述数据读取请求在索引数组信息中确定目标存储位置;其中,所述索引数组信息基于每个数据块中的索引信息而确定,并包括每个数据块中存储的图谱数据的初始实体标识、末尾实体标识、与末尾实体标识相关联的边属性条件;基于所述目标存储位置从目标数据块中读取所述目标数据。8.根据权利要求7所述的数据读取方法,所述接收针对目标数据的数据读取请求,基