预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113672735A(43)申请公布日2021.11.19(21)申请号202111048789.4(22)申请日2021.09.08(71)申请人北京邮电大学地址100876北京市海淀区西土城路10号(72)发明人石川杨成许斯泳(74)专利代理机构北京挺立专利事务所(普通合伙)11265代理人高福勇(51)Int.Cl.G06F16/35(2019.01)G06F40/30(2020.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书3页说明书11页附图1页(54)发明名称一种基于主题感知异质图神经网络的链接预测方法(57)摘要本发明公开了一种基于主题感知异质图神经网络的链接预测方法,旨在进一步挖掘基于结构语义的细粒度主题感知语义,用于HGs中的多方面主题感知表示学习。具体地,本发明首先应用多方面转换矩阵将不同类型节点的向量表示映射到多个主题感知子空间中;然后应用了交替的两步聚合机制,包括元路径内分解和元路径间合并,来学习每个目标节点的多方面主题感知表示;此外引入主题先验指导模块,它利用主题建模从非结构化文本内容中获取全局统计知识,有助于指导上下文聚合,作为一个正则化器,该模块使得所推断的主题感知子空间更加正交化,并提高所学多方面主题感知表示的可解释性。CN113672735ACN113672735A权利要求书1/3页1.一种基于主题感知异质图神经网络的链接预测方法,其特征在于,包括多方面映射、多方面异质图神经网络建立和主题先验指导的步骤;其中,多方面映射步骤作为预处理阶段,将不同类型的节点特征表示投影到指示多方面主题感知语义的相同共享潜在向量子空间中,为主题感知异质图神经网络聚合过程做准备;多方面异质图神经网络建立步骤包括元路径内分解和元路径间合并两个步骤,元路径内分解以捕获主题感知语义,元路径间合并以保留结构语义,两个步骤迭代地学习具有多方面因素节点的多面主题感知表示;主题先验指导步骤作为正则化器,利用主题模型从非结构化文本内容中获取全局统计知识,指导上下文聚合,进一步保持多方面主题感知表示的质量。2.根据权利要求1所述的基于主题感知异质图神经网络的链接预测方法,其特征在于,在多方面映射步骤中,假设在HG中存在K个潜在主题感知子空间,对于每种类型的节点,应用K个类型特定的线性变换矩阵将特征向量投影到K个潜在主题感知子空间,经过多方面映射后,所有节点特征共享着相同的D维,由K部分组成。3.根据权利要求2所述的基于主题感知异质图神经网络的链接预测方法,其特征在于,对于类型为的节点u∈V,多方面映射过程表示如下:其中,k=1,2,…,K,是节点u的原始特征向量,是在第k个潜在主题感知子空间下的映射向量,是针对类型为的节点第k个可训练的权重矩阵。4.根据权利要求2所述的基于主题感知异质图神经网络的链接预测方法,其特征在于,多方面映射步骤的采样方法为:给定HG中一个具有多方面因素节点u,根据公式(2)采集包含了多个具有高主题一致性的文本相关节点的基于元路径的上下文:其中,为基于元路径M的上下文cu的采样概率,是通过主题模型LDA预先计算得到的上下文cu中节点vs包含的文本内容的主题概率分布。5.根据权利要求1所述的基于主题感知异质图神经网络的链接预测方法,其特征在于,多方面异质图神经网络建立方程为:其中,g(·)是学习节点u的最终多方面主题感知表示yu的聚合函数,指的是第k个主题感知子空间中给予元路径的上下文cu的表示,yu由K个部分组成yu=[zu,1,zu,2,…,zu,K],其中能够刻画节点u的第k种主题感知因素性质。6.根据权利要求1所述的基于主题感知异质图神经网络的链接预测方法,其特征在于,2CN113672735A权利要求书2/3页元路径内分解步骤的具体方法为:给定目标节点u的多方面投影后的特征向量,以及一组选定的元路径M=(M1,M2,…,MP),对于u,元路径内分解为u生成P组元路径特定的多方面主题感知表示,表示为7.根据权利要求6所述的基于主题感知异质图神经网络的链接预测方法,其特征在于,元路径间合并步骤的具体方法为:用权重矩阵W来转换元路径特定的单一表示,然后通过对每批数据中目标节点的转换后的元路径特定的单一表示进行平均在第k个主题感知的子空间中总结元路径Mi:其中,k=1,2,…,K,是可学习参数,B是批处理的大小;然后使用多方面注意力向量根据公式(8)和(9)来衡量每个主题感知子空间中的元路径Mi的重要性:其中为元路径Mi的贡献;使用计算出的系数合并所有元路径特定的多方面表示,在当前迭代中获得最终的多方面主题感知表示为:其中k=1,2,…,K。8.根据权利要求7所述的基于主题感知异质图神经网络的链