预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113886605A(43)申请公布日2022.01.04(21)申请号202111243147.XG06F40/30(2020.01)(22)申请日2021.10.25(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人赵登何建杉胡彬方涛刘志臻桂正科梁磊王太峰褚崴(74)专利代理机构成都七星天知识产权代理有限公司51253代理人袁春晓(51)Int.Cl.G06F16/36(2019.01)G06F16/35(2019.01)G06F40/289(2020.01)权利要求书2页说明书13页附图5页(54)发明名称一种知识图谱处理方法和系统(57)摘要本说明书实施例提供了一种知识图谱处理方法和系统,方法包括:基于目标业务域涉及的一个或多个实体类型从共享知识图谱中选取若干节点及其边,得到目标子图谱;所述共享知识图谱基于一个或多个业务域的知识图谱融合得到;对所述目标子图谱进行处理,以提取一种或多种图谱特征,所述图谱特征包括以下中的部分或全部:节点表征向量、边表征向量、图结构特征、图谱中文本信息的语义特征、图谱规则特征;将所述图谱特征提供给目标业务域的目标数据处理任务;其中,所述图谱特征用于与任务定制化特征一同作为所述目标数据处理任务的输入特征,以实现目标数据处理任务。CN113886605ACN113886605A权利要求书1/2页1.一种知识图谱处理方法,包括:基于目标业务域涉及的一个或多个实体类型从共享知识图谱中选取若干节点及其边,得到目标子图谱;所述共享知识图谱基于一个或多个业务域的知识图谱融合得到;对所述目标子图谱进行处理,以提取一种或多种图谱特征,所述图谱特征包括以下中的部分或全部:节点表征向量、边表征向量、图结构特征、图谱中文本信息的语义特征、图谱规则特征;将所述图谱特征提供给目标业务域的目标数据处理任务;其中,所述图谱特征用于与任务定制化特征一同作为所述目标数据处理任务的输入特征,以实现目标数据处理任务。2.如权利要求1所述的方法,所述图结构特征包括以下中的一种或多种:度信息、PageRank值、点聚类系数、紧密中心性、本征向量中心性、共同邻居指标、Katz指标、随机游走相似性。3.如权利要求1所述的方法,还包括:基于所述目标数据处理任务从共享知识图谱中召回若干候选节点;所述候选节点为目标数据处理任务的处理对象;其中,召回的方式包括基于检索条件在共享知识图谱中查询以获得所述候选节点,或者基于目标向量通过向量检索从共享知识图谱中获取所述候选节点。4.如权利要求1所述的方法,所述基于目标业务域涉及的一个或多个实体类型从共享知识图谱中选取若干节点及其边,得到目标子图谱,还包括:获取所述目标子图谱的宏观特征,所述宏观特征包括以下中的一种或多种:实体数量、图谱的度分布、图谱的连通度分布、图谱的数据质量评分;基于所述宏观特征确定所述目标子图谱是否满足要求,若不满足则对目标子图谱进行修改或者重新从所述共享知识图谱中获取目标子图谱。5.如权利要求1所述的方法,所述目标子图谱为异质图谱;所述对所述目标子图谱进行处理,以提取一种或多种图谱特征,包括:将目标子图谱分解成多个同质图谱;对同质图谱分别进行处理,以提取一种或多种图谱特征。6.如权利要求1所述的方法,所述目标数据处理任务为实体分类、实体间关系预测或者实体集合挖掘。7.一种知识图谱处理系统,包括:子图谱确定模块,用于基于目标业务域涉及的一个或多个实体类型从共享知识图谱中选取若干节点及其边,得到目标子图谱;所述共享知识图谱基于一个或多个业务域的知识图谱融合得到;图谱特征获取模块,用于对所述目标子图谱进行处理,以提取一种或多种图谱特征,所述图谱特征包括以下中的部分或全部:节点表征向量、边表征向量、图结构特征、图谱中文本信息的语义特征、图谱规则特征;任务处理模块,用于将所述图谱特征提供给目标业务域的目标数据处理任务;其中,所述图谱特征用于与任务定制化特征一同作为所述目标数据处理任务的输入特征,以实现目标数据处理任务。8.如权利要求7所述的系统,所述图结构特征包括以下中的一种或多种:度信息、2CN113886605A权利要求书2/2页PageRank值、点聚类系数、紧密中心性、本征向量中心性、共同邻居指标、Katz指标、随机游走相似性。9.如权利要求7所述的系统,还包括召回模块,所述召回模块用于:基于所述目标数据处理任务从共享知识图谱中召回若干候选节点;所述候选节点为目标数据处理任务的处理对象;其中,召回的方式包括基于检索条件在共享知识图谱中查询以获得所述候选节点,或者基于目标向量通过向量检索从共享知识图谱中获取所述候选节点。10.如权利要