预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115098699A(43)申请公布日2022.09.23(21)申请号202210728837.2(22)申请日2022.06.24(71)申请人中国人民解放军国防科技大学地址410073湖南省长沙市开福区德雅路109号(72)发明人张鹏飞彭娟曾平杜振国肖卫东赵翔谭真(74)专利代理机构长沙大珂知识产权代理事务所(普通合伙)43236专利代理师伍志祥(51)Int.Cl.G06F16/36(2019.01)G06K9/62(2022.01)权利要求书3页说明书11页附图2页(54)发明名称一种基于知识图谱嵌入模型的链路预测方法(57)摘要本发明公开了一种基于知识图谱嵌入模型的链路预测方法,包括:获取知识图谱;对于instanceof三元组单独建模,对于概念三元组中的subclassof三元组,利用subclassof关系的传递性进行建模,对于概念三元组中除subclassof三元组的三元组和实例三元组统一归类为关系三元组并建模;使用基于边际参数的损失函数作为优化目标进行训练;采用随机梯度下降算法来最小化所述损失函数,训练结束后得到模型的超参数;将缺失头实体或尾实体的关系三元组输入模型,输出预测结果。本发明缓解实例和概念在同一空间建模带来的实例和概念的嵌入表示聚集从而影响模型效果的问题,很好的建模概念层次性和isA关系的传递性。CN115098699ACN115098699A权利要求书1/3页1.一种基于知识图谱嵌入模型的链路预测方法,其特征在于,包括以下步骤:获取知识图谱KG={C、I、R、S},其中C、I、R、S分别表示概念集、实例集、关系集和三元组集;所述三元组集S包含头实体和尾实体都由概念组成的概念三元组、头实体和尾实体都由实例组成的实例三元组以及头实体和尾实体分别由实例和概念组成的instanceof三元组;对于instanceof三元组,由于头实体和尾实体不能在同一个嵌入空间表示,单独建模,对于概念三元组中的subclassof三元组,利用subclassof关系的传递性进行建模,对于概念三元组中除subclassof三元组的三元组和实例三元组统一归类为关系三元组并建模;使用基于边际参数的损失函数作为优化目标进行训练,所述损失函数限制正三元组的分数至少比其负三元组的分数少边际参数γ,以提高正负样本之间可区分性;采用随机梯度下降算法来最小化所述损失函数,模型训练时,强制约束所有的关系三元组中的实体和关系、instanceof三元组以及subclassof中的实例和概念的L2范数小于等于1,训练结束后得到模型的超参数;将缺失头实体或尾实体的关系三元组(h,r,t)输入模型,给定(h,r)输出预测结果t或者给定(r,t)输出预测结果h。2.根据权利要求1所述的一种基于知识图谱嵌入模型的链路预测方法,其特征在于,实例和概念分别在实例嵌入表示空间和概念嵌入表示空间表示,实例嵌入表示空间维度de比概念嵌入表示空间维度dc高,即de>dc。3.根据权利要求1所述的一种基于知识图谱嵌入模型的链路预测方法,其特征在于,将关系集R形式化为其中,ri表示instanceof关系,rs表示subclassof关系,是实例关系集,是除rs关系外的概念关系集,将三元组集S分为三个不相交的子集:instanceof三元组集其中i∈I,其嵌入表示c∈C,其嵌入表示ne是Se的大小;subclassof三元组集其中ci、cj∈C,其嵌入表示ci是cj的子概念,nc是Sc的大小;关系三元组集其中h、r、t∈C或h、r、t∈I,其嵌入表示分别用h,r,t描述,或nr是Sr的大小,为实例关系三元组集,其中he,te∈I,是的大小,为概念关系三元组集,其中hc,tc∈C,是的大小。4.根据权利要求1所述的一种基于知识图谱嵌入模型的链路预测方法,其特征在于,对于instanceof三元组(i,ri,c)建模如下:实例i与概念c嵌入表示分别为e和o,在不同的嵌入表示空间;由于实例i具有概念c的属性信息,实例i的嵌入表示e通过映射后与概念c的嵌入表示向量o接近,即:对于2CN115098699A权利要求书2/3页instanceof三元组(i,ri,c),存在fins(e)→oinstanceof三元组为多对多关系,即一个概念可包含多个实例,一个实例可属于多个概念;对于一个概念对应多个实例的情况,定义fins(e)为非线性仿射函数,即:fins(e)=σ(W·e+b)其中,为权重矩阵,为偏置向量,σ(·)为非线性激活函数;对于同一个实例可能对应多个不同的概念的情况,为每个概念的嵌入表示增加一个可学习参数δc,表示o的δc邻域作用范围,实例i的嵌入表示e经过映射后,位于概念c的嵌入向量表示o的δc邻域