预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共28页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113723605A(43)申请公布日2021.11.30(21)申请号202010457160.4(22)申请日2020.05.26(71)申请人株式会社理光地址日本东京都(72)发明人丁磊童毅轩张佳师姜珊珊张永伟(74)专利代理机构北京银龙知识产权代理有限公司11243代理人黄灿王丹(51)Int.Cl.G06N3/08(2006.01)G06N5/02(2006.01)权利要求书3页说明书13页附图11页(54)发明名称实体链接方法、装置及可读存储介质(57)摘要本发明公开了一种实体链接方法、装置及可读存储介质,涉及实体链接技术领域,以降低实体链接的成本。该方法包括:获取输入的语句,其中,所述输入的语句中包括实体称谓;生成所述实体称谓的候选实体集;将所述实体称谓链接到所述候选实体集中的目标候选实体。本发明实施例可降低实体链接的成本。CN113723605ACN113723605A权利要求书1/3页1.一种实体链接方法,其特征在于,包括:获取输入的语句,其中,所述输入的语句中包括实体称谓;生成所述实体称谓的候选实体集;将所述实体称谓链接到所述候选实体集中的目标候选实体。2.根据权利要求1所述的方法,其特征在于,所述生成所述实体称谓的候选实体集,包括:获取所述实体称谓在所述输入的语句中的上下文相关实体称谓;从知识库中获取所述实体称谓的第一相似实体;从所述知识库中获取所述上下文相关实体称谓的第二相似实体;利用所述第一相似实体和所述第二相似实体的相关实体形成所述候选实体集。3.根据权利要求2所述的方法,其特征在于,所述从知识库中获取所述实体称谓的第一相似实体,包括:生成所述实体称谓的词向量表示;通过映射模型将所述词向量表示映射成实体表示向量;计算所述实体表示向量和所述知识库中的实体表示向量之间的相似度;将所述知识库中的第一目标实体表示向量对应的实体,作为所述第一相似实体,所述第一目标实体表示向量和所述实体表示向量之间的相似度符合第一预设要求。4.根据权利要求2所述的方法,其特征在于,所述从所述知识库中获取所述上下文相关实体称谓的第二相似实体,包括:生成所述上下文相关实体称谓的词向量表示;通过映射模型将所述词向量表示映射成实体表示向量;计算所述实体表示向量和所述知识库中的实体表示向量之间的相似度;将所述知识库中的第二目标实体表示向量对应的实体,作为所述第二相似实体,所述第二目标实体表示向量和所述实体表示向量之间的相似度符合第二预设要求。5.根据权利要求3或4所述的方法,其特征在于,所述方法还包括:生成所述映射模型。6.根据权利要求5所述的方法,其特征在于,所述生成所述映射模型,包括:从文本语料库中获取训练词向量表示;从知识库中获取训练实体表示向量;利用所述训练词向量表示和所述训练实体表示向量训练神经网络模型,得到所述映射模型。7.根据权利要求6所述的方法,其特征在于,所述训练实体表示向量通过以下目标函数得到:其中,L表示目标函数的值,α(h,r,t)表示实体h和实体t之间关系的权重,r表示实体h和实体t之间关系的表示向量,t′表示从所述知识库中随机选取的实体,S表示所述知识库中不同实体以及实体之间的关系的集合。2CN113723605A权利要求书2/3页8.根据权利要求1所述的方法,其特征在于,所述将所述实体称谓链接到所述候选实体集中的目标候选实体,包括:解析所述输入的语句,得到所述输入的语句中的实体关系;将所述输入的语句中的实体关系映射到知识库中的实体关系;计算目标组合的关系真实性值,其中,所述目标组合为由所述候选实体集中的候选实体、所述实体称谓在所述输入的语句中的上下文相关实体称谓以及所述知识库中的实体关系所形成的组合;将关系真实性值最小的目标组合中的第一候选实体,作为所述目标候选实体;将所述实体称谓链接到所述目标候选实体。9.一种实体链接装置,其特征在于,包括:第一获取模块,用于获取输入的语句,其中,所述输入的语句中包括实体称谓;第一生成模块,用于生成所述实体称谓的候选实体集;第一链接模块,用于将所述实体称谓链接到所述候选实体集中的目标候选实体。10.根据权利要求9所述的装置,其特征在于,所述第一生成模块包括:第一获取子模块,用于获取所述实体称谓在所述输入的语句中的上下文相关实体称谓;第二获取子模块,用于从知识库中获取所述实体称谓的第一相似实体;第三获取子模块,用于从所述知识库中获取所述上下文相关实体称谓的第二相似实体;第一生成子模块,用于利用所述第一相似实体和所述第二相似实体的相关实体形成所述候选实体集。11.根据权利要求10所述的装置,其特征在于,所述第二获取子模块包括:第一生成单元,用于生成所述实体称谓的词向量表示;第一映射单元,用于通过映射