预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113987193A(43)申请公布日2022.01.28(21)申请号202110886095.1(22)申请日2021.08.03(71)申请人北京小米移动软件有限公司地址100085北京市海淀区西二旗中路33号院6号楼8层018号申请人北京小米松果电子有限公司(72)发明人孛瑞朋彭力陈帅(74)专利代理机构北京博思佳知识产权代理有限公司11415代理人王茹(51)Int.Cl.G06F16/36(2019.01)G06F40/295(2020.01)权利要求书3页说明书13页附图6页(54)发明名称实体消歧及实体链接方法(57)摘要本公开涉及计算机数据处理技术领域,具体涉及一种实体消歧及实体链接方法。一种实体消歧方法,包括:获取目标文本中的待消歧实体以及所述待消歧实体与关联实体的关联属性信息,所述关联属性是实体的关键属性的子属性;基于实体的关键属性信息以及所述关联属性信息,构建所述待消歧实体的每个候选实体对应的文本描述;根据各个所述文本描述由所述候选实体中确定目标实体。本公开实施方式利用关联属性信息更好地辅助实体消歧,提高实体消歧的准确性。CN113987193ACN113987193A权利要求书1/3页1.一种实体消歧方法,其特征在于,包括:获取目标文本中的待消歧实体以及所述待消歧实体与关联实体的关联属性信息,所述关联属性是实体的关键属性的子属性;基于实体的关键属性信息以及所述关联属性信息,构建所述待消歧实体的每个候选实体对应的文本描述;根据所述文本描述,由所述候选实体中确定目标实体。2.根据权利要求1所述的方法,其特征在于,所述目标文本包括SPO三元组文本;所述获取目标文本中的待消歧实体以及所述待消歧实体与关联实体的关联属性信息包括:获取所述SPO三元组文本中的待消歧实体和与所述待消歧实体相关联的关联实体;根据所述SPO三元组文本,确定所述待消歧实体与所述关联实体的关联属性信息。3.根据权利要求1所述的方法,其特征在于,所述基于实体的关键属性信息以及所述关联属性信息,构建所述待消歧实体的每个候选实体对应的文本描述,包括:获取知识库中每个所述候选实体的所述关键属性信息;根据所述关键属性信息构建所述候选实体对应的第一文本;根据所述第一文本、所述目标文本以及所述关联属性信息,构建所述候选实体对应的所述文本描述。4.根据权利要求3所述的方法,其特征在于,所述获取知识库中每个所述候选实体的所述关键属性信息,包括:根据知识库中每个所述候选实体在预设类别的关键属性下的信息,确定所述候选实体的所述关键属性信息。5.根据权利要求1至4任一项所述的方法,其特征在于,所述根据所述文本描述,由所述候选实体中确定目标实体,包括:提取所述文本描述的文本信息和所述文本描述中所述待消歧实体的位置信息;根据所述文本信息和所述位置信息,确定所述文本描述对应的候选实体与所述待消歧实体的相似度;根据各个文本描述对应的相似度排序,由所述候选实体中确定所述目标实体。6.根据权利要求5所述的方法,其特征在于,所述根据所述文本描述由所述候选实体中确定目标实体,包括:将各个所述文本描述输入预先训练好的实体消歧网络,所述实体消歧网络提取所述文本描述的文本信息和所述文本描述中所述待消歧实体的位置信息;所述实体消歧网络根据所述文本信息和所述位置信息,确定所述文本描述对应的候选实体与所述待消歧实体的相似度;所述实体消歧网络根据各个文本描述对应的相似度排序,由所述候选实体中确定所述目标实体。7.根据权利要求6所述的方法,其特征在于,对所述实体消歧网络训练的过程包括如下步骤:获取文本样本集;所述文本样本集中的每个文本样本包括文本描述以及该文本描述对应的标签信息;将所述文本样本集输入未训练的实体消歧网络,得到所述实体消歧网络输出的输出结2CN113987193A权利要求书2/3页果;根据所述输出结果与所述标签信息之间的差异,调整所述实体消歧网络的网络参数,直至满足收敛条件。8.一种实体链接方法,其特征在于,包括:将目标文本中的待消歧实体与目标实体进行实体链接;其中所述目标实体根据权利要求1至7任一项所述的实体消歧方法得到。9.一种实体消歧装置,其特征在于,包括:获取模块,被配置为获取目标文本中的待消歧实体以及所述待消歧实体与关联实体的关联属性信息,所述关联属性是实体的关键属性的子属性;文本构建模块,被配置为基于实体的关键属性信息以及所述关联属性信息,构建所述待消歧实体的每个候选实体对应的文本描述;确定模块,被配置为根据所述文本描述由所述候选实体中确定目标实体。10.根据权利要求9所述的装置,其特征在于,所述目标文本包括SPO三元组文本,所述获取模块具体被配置为:获取所述SPO三元组文本中的待消歧实体和与