预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共73页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113806561A(43)申请公布日2021.12.17(21)申请号202111184099.1G06N3/08(2006.01)(22)申请日2021.10.11(71)申请人中国人民解放军国防科技大学地址410073湖南省长沙市开福区德雅路109号(72)发明人黄震王艺霖李东升郭敏杨东杨森孙鼎(74)专利代理机构湖南企企卫知识产权代理有限公司43257代理人任合明(51)Int.Cl.G06F16/36(2019.01)G06F16/33(2019.01)G06F40/30(2020.01)G06N3/04(2006.01)权利要求书24页说明书44页附图4页(54)发明名称一种基于实体属性的知识图谱事实补全方法(57)摘要本发明涉及一种基于实体属性的知识图谱事实补全方法,目的是提高知识图谱事实预测的平均精度均值,补全更可靠的事实。技术方案是:构建由数据预处理模块、事实预测网络、事实补全模块构成的基于路径的知识图谱事实补全系统。根据用户需要进行补全的知识图谱,数据预处理模块准备训练数据、验证数据和补全数据。事实预测网络由嵌入层、关系编码器、实体编码器、路径编码器、预测器五部分构成,使用训练数据和验证数据对网络进行训练和验证;训练好的事实预测网络对补全数据进行预测得到预测结果,事实补全模块根据预测结果将知识图谱补全。采用本发明可提升事实预测网络预测的平均精度均值,使得补全到知识图谱中的事实可信度更高。CN113806561ACN113806561A权利要求书1/24页1.一种基于实体属性的知识图谱事实补全方法,其特征在于包括以下步骤:第一步:构建基于路径的知识图谱事实补全系统,该系统由数据预处理模块、事实预测网络、事实补全模块构成;数据预处理模块与事实预测网络相连,接收用户输入的知识图谱,对用户输入的知识图谱进行预处理,得到训练事实预测网络所需的训练数据即训练样本的数据集合和训练样本的标签集合、验证事实预测网络所需的验证数据即验证样本的数据集合和验证样本的标签集合、以及事实补全模块所需的要判断是否为缺失事实的补全数据即补全样本的数据集合,输出给事实预测网络,并将补全样本的数据集合输出给事实补全模块;数据预处理模块由路径抽取函数fExtractPath和路径预处理函数fPreprocessPaths构成,其中fExtractPath从知识图谱中抽取每个样本的实体之间的路径信息,fpreprocessPaths将每个样本的实体间路径信息处理为事实预测网络需要的数据结构;将知识图谱中的实体集合、关系集合、事实集合分别记为E={ei},R={rj}和将实体的属性集合记为A={av},将实体的类型集合记为L={lo},其中1≤i≤|E|,1≤i1≤|E|,1≤i2≤|E|,1≤j≤|R|,1≤v≤|A|,1≤o≤|L|,|E|、|R|、|A|、|L|分别表示实体的总数、关系的总数、属性的总数和类型的总数;将r′j记为rj的反关系,表示若则根据E、R、F、A、L,数据预处理模块获取训练样本集合S*、训练样本的标签集合Y*、验证样本集合S#、验证样本的标签集合Y#、以及补全样本集合U;对于S*、S#、U中的每个样本,数据预处理模块先使用fExtractPath从知识图谱中抽取样本的实体对之间的正向路径集合,然后使用fPreprocessPaths处理该正向路径集合输出样本的数据集合,构成训练样本的数据集合、验证样本的数据集合、补全样本的数据集合;事实预测网络由嵌入层、关系编码器、实体编码器、路径编码器、预测器五个部分组成;其中,嵌入层包含3个嵌入矩阵,分别为关系的嵌入矩阵Wr、实体属性的嵌入矩阵WA、实体类型的嵌入矩阵WL;关系编码器用于提取每条路径的关系序列特征,由一个LSTM网络构成,记为LSTMr;实体编码器用于提取每条路径的实体序列特征即每条路径上实体的属性信息序列的特征和类型信息序列的特征,由实体画像注意力网络和实体序列编码网络两个子网络构成,其中实体画像注意力网络由结构相同的实体属性注意力网络和实体类型注意力网络构成,实体属性注意力网络由4个全连接层构成,实体类型注意力网络由4个全连接层构成,而实体序列编码网络由两个LSTM网络即LSTMA和LSTML及4个全连接层构成;路径编码器由结构相同的正向路径注意力网络和反向路径注意力网络构成,其中正向路径注意力网络由2个全连接层fp和构成,反向路径注意力网络由2个全连接层f′p和构成,分别用于聚合每个样本的所有正向路径的特征和所有反向路径的特征;预测器由4个全连接层f1,f2,f3和f4构成,用于预测每个样本属于事实的概率;事实预测网络从数据预处理模块得到包含训练样本的数据集合、验证样本的数据集合、补全