预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共40页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113761784A(43)申请公布日2021.12.07(21)申请号202110494893.XG06N20/00(2019.01)(22)申请日2021.05.07G06F111/08(2020.01)(71)申请人腾讯科技(深圳)有限公司地址518000广东省深圳市南山区高新区科技中一路腾讯大厦35层申请人中国科学院自动化研究所(72)发明人方全韩艳飞徐常胜吴贤王巨宏(74)专利代理机构广州嘉权专利商标事务所有限公司44205代理人谭英强黎扬鹏(51)Int.Cl.G06F30/27(2020.01)G06F17/16(2006.01)G06K9/62(2006.01)权利要求书4页说明书22页附图13页(54)发明名称数据处理方法、数据处理模型的训练方法及装置(57)摘要本发明实施例公开了一种数据处理方法、数据处理模型的训练方法及装置,其中,该数据处理方法通过根据与目标实体节点之间的实体关系相同的邻居实体节点与目标实体节点得到第一子图,根据第一子图中目标实体节点与邻居实体节点的连接结构,得到第一子图中所有实体节点的实体节点特征集合,根据实体节点特征集合得到第一子图的第一子图特征,聚合多个第一子图特征得到目标实体节点对应的目标实体特征,由于目标实体特征根据多个对应不同实体关系的第一子图聚合得到,因而最终得到的目标实体特征嵌入了不同实体关系对应的特征信息,从而使得目标实体特征的表达更加丰富,能够提高目标实体特征的准确性,可广泛应用在人工智能领域。CN113761784ACN113761784A权利要求书1/4页1.一种数据处理方法,其特征在于,包括:获取图结构数据;获取所述图结构数据中的目标实体节点和与所述目标实体节点相邻的邻居实体节点,获取所述邻居实体节点与所述目标实体节点之间的实体关系,根据所述实体关系相同的邻居实体节点以及所述目标实体节点得到第一子图,所述第一子图的数量为多个,不同的所述第一子图对应不同的实体关系;根据所述第一子图中所述目标实体节点与所述邻居实体节点的连接结构,得到所述第一子图中所有实体节点的实体节点特征集合,根据所述实体节点特征集合得到所述第一子图的第一子图特征;聚合多个所述第一子图特征得到所述目标实体节点对应的目标实体特征。2.根据权利要求1所述的数据处理方法,其特征在于,所述根据所述实体关系相同的邻居实体节点以及所述目标实体节点得到第一子图,包括:以所述目标实体节点为中心,将所述实体关系相同的邻居实体节点与所述目标实体节点连接,得到所述目标实体节点对应的第一子图。3.根据权利要求1所述的数据处理方法,其特征在于,所述实体节点特征集合采用第二实体节点特征矩阵表示,所述根据所述第一子图中所述目标实体节点与所述邻居实体节点的连接结构,得到所述第一子图中所有实体节点的实体节点特征集合,包括:获取所述第一子图初始的第一实体节点特征矩阵;根据所述第一子图中所述目标实体节点与所述邻居实体节点的连接结构得到所述第一子图对应的邻接矩阵;获取所述邻接矩阵对应的对角度矩阵;利用激活函数对所述第一实体节点特征矩阵、所述邻接矩阵以及所述对角度矩阵进行激活处理,得到所述第二实体节点特征矩阵。4.根据权利要求1所述的数据处理方法,其特征在于,所述实体节点特征集合采用第二实体节点特征矩阵表示,所述第二实体节点特征矩阵包括所述目标实体节点的第一实体编码向量和所述邻居实体节点的第二实体编码向量,所述第一子图特征采用第一子图向量表示,所述根据所述实体节点特征集合得到所述第一子图的第一子图特征,包括:对所述第一实体编码向量和所述第二实体编码向量进行平均处理,得到所述第一子图向量。5.根据权利要求1所述的数据处理方法,其特征在于,所述第一子图特征采用第一子图向量表示,所述目标实体特征采用目标实体向量表示,所述聚合多个所述第一子图特征得到所述目标实体节点对应的目标实体特征,包括:获取所述第一子图包含的实体节点数量,以所述实体节点数量作为向量维度,得到所述第一子图向量对应的偏置向量;获取第一注意力向量以及所述第一子图对应的权重向量;根据所述第一子图向量、所述偏置向量、所述第一注意力向量以及所述权重向量得到第二注意力向量,对所述第二注意力向量进行归一化处理,得到所述第一子图向量对应的权重值;根据所述权重值对多个所述第一子图向量进行加权处理,得到所述目标实体向量。2CN113761784A权利要求书2/4页6.根据权利要求5所述的数据处理方法,其特征在于,所述根据所述第一子图向量、所述偏置向量、所述第一注意力向量以及所述权重向量得到第二注意力向量,包括:对所述第一子图向量进行转矩处理后与所述权重向量相乘,得到第一参数;利用双曲正切函数对所述第一参数与所述偏置向量之和