预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN116028634A(43)申请公布日2023.04.28(21)申请号202211182929.1G06F16/335(2019.01)(22)申请日2022.09.27G06F16/332(2019.01)G06N3/08(2023.01)(71)申请人北京捷通华声科技股份有限公司G06F40/211(2020.01)地址100193北京市海淀区东北旺西路8号G06N3/04(2023.01)9号楼3层2区318G06N3/0442(2023.01)(72)发明人杨春阳邢启洲李健陈明武卫东(74)专利代理机构北京润泽恒知识产权代理有限公司11319专利代理师莎日娜(51)Int.Cl.G06F16/36(2019.01)G06F40/295(2020.01)G06F18/22(2023.01)G06F18/214(2023.01)权利要求书2页说明书12页附图3页(54)发明名称实体链接的构建方法、装置、电子设备和可读存储介质(57)摘要本发明实施例提供了一种实体链接的构建方法、装置和可读存储介质,所述方法包括:获取自然语言问题文本;对所述自然语言问题文本进行实体分析,得到所述自然语言问题文本中的实体信息;基于所述实体信息,计算所述自然语言问题文本中的实体与知识库中实体的相似度,得到所述自然语言问题的候选链接结果;基于所述实体的依存关系信息,对所述候选链接结果进行筛选,得到最终的实体链接。在实体链接过程中结合了文本中实体命名实体信息与依存关系信息,增强了文本中实体与上下文的联系,有效提高了实体链接的准确率,解决了实体链接的准确率低和误召回率高的问题,提高了知识图谱问答的准确率。CN116028634ACN116028634A权利要求书1/2页1.一种实体链接的构建方法,其特征在于,包括:获取自然语言问题文本;对所述自然语言问题文本进行实体分析,得到所述自然语言问题文本中的实体信息;所述实体信息包括实体的命名信息和实体的依存关系信息;基于所述实体信息,计算所述自然语言问题文本中的实体与知识库中实体的相似度,得到所述自然语言问题的候选链接结果;基于所述实体的依存关系信息,对所述候选链接结果进行筛选,得到最终的实体链接。2.根据权利要求1所述的方法,所述对所述自然语言问题文本进行实体分析,得到所述自然语言问题文本中的实体信息,包括:利用基于BERT‑CRF的命名实体模型对所述自然语言问题文本进行命名实体识别,得到所述自然语言问题文本中的实体的命名信息;利用基于BiLSTM的句法分析模型对所述命名信息进行依存分析,得到自然语言问题文本中的实体的依存关系信息。3.根据权利要求2所述的方法,其特征在于,在步骤利用基于BERT‑CRF的命名实体模型对所述自然语言问题文本进行命名实体识别,得到所述自然语言问题文本中的实体的命名信息之前,还包括:获取命名实体模型的原始文本数据集;对所述原始文本数据集中的字符进行标注,得到标注文本数据集;所述标注的类别包括开始字符、中间字符和无关字符;将所述标注文本数据集按比例划分为训练集、测试集和验证集;基于所述训练集、测试集和验证集搭建所述命名实体模型。4.根据权利要求1所述的方法,其特征在于,所述相似度包括所述自然语言问题文本中与知识库中数值类实体的相似度、所述自然语言问题文本中与知识库中非数值类实体的相似度。5.根据权利要求4所述的方法,其特征在于,当计算所述自然语言问题文本中与知识库中数值类实体的相似度时,所述基于所述实体信息,计算所述自然语言问题文本中的实体与知识库中实体的相似度,得到所述自然语言问题的候选链接结果,包括:基于所述实体信息,对所述计算所述自然语言问题文本中与知识库中数值类实体进行数字归一化处理;计算数字归一化处理后的所述自然语言问题文本中的数值类实体与知识库中数值类实体之间的编辑距离,以所述编辑距离为所述自然语言问题文本中的数值类实体与知识库中数值类实体的相似度;当所述相似度不大于第一相似度阈值时,将所述相似度对应的知识库中的数值类实体划入所述自然语言问题的候选链接结果。6.一种知识图谱问答方法,其特征在于,包括:客户端接收用户的问答请求;客户端将所述问答请求发送至服务端;服务端构建所述问答请求的文本信息与知识库的实体链接;服务端基于所述实体链接,将链接到的知识库中的实体信息作为答案返回给客户端呈2CN116028634A权利要求书2/2页现给用户;其中,所述实体链接为根据权利要求1至5任一项所述的实体链接的构建方法构建得到的。7.一种实体链接的构建装置,其特征在于,包括:文本获取模块,用于获取自然语言问题文本;实体分析模块,用于对所述自然语言问题文本进行实体分析,得到所述自然语言问题文本中的实体信息;所述实体信息包括