预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共29页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114281951A(43)申请公布日2022.04.05(21)申请号202110931415.0(22)申请日2021.08.13(71)申请人腾讯科技(深圳)有限公司地址518057广东省深圳市南山区高新区科技中一路腾讯大厦35层(72)发明人杨奕凡张子恒徐超孙继超(74)专利代理机构北京三高永信知识产权代理有限责任公司11138代理人张所明(51)Int.Cl.G06F16/332(2019.01)G06F16/35(2019.01)G06F16/36(2019.01)G06F16/33(2019.01)权利要求书4页说明书16页附图8页(54)发明名称信息获取方法、装置、设备及存储介质(57)摘要本申请实施例公开了一种信息获取方法、装置、设备及存储介质,属于人工智能技术领域。所述方法包括:获取自然语言问题的意图分类结果,意图分类结果用于指示自然语言问题对应的意图类型;根据意图分类结果从多个检索方式中确定出目标检索方式;其中,多个检索方式分别用于获取不同专业程度的知识;采用目标检索方式,从目标检索方式对应的知识库中检索出自然语言问题的答案。本申请通过对不同意图类型的自然语言问题进行不同专业程度的答案检索,确保了答案的专业性,从而提高信息获取的准确性和灵活性。同时,由于本申请不局限于从单一的知识库中获取答案,从而确保了信息的召回量。本申请可适用于医疗领域的智能问答(如用药、问诊等)。CN114281951ACN114281951A权利要求书1/4页1.一种信息获取方法,其特征在于,所述方法包括:获取自然语言问题;对所述自然语言问题进行意图分类,得到意图分类结果,所述意图分类结果用于指示所述自然语言问题对应的意图类型;根据所述意图分类结果从多个检索方式中确定出目标检索方式;其中,所述多个检索方式分别用于获取不同专业程度的知识;采用所述目标检索方式,从所述目标检索方式对应的知识库中检索出所述自然语言问题的答案。2.根据权利要求1所述的方法,其特征在于,所述意图类型包括第一意图类型和第二意图类型:其中,所述第一意图类型用于指示获取目标领域的专业知识,所述第二意图类型用于指示获取所述目标领域的附加知识;所述采用所述目标检索方式,从所述目标检索方式对应的知识库中检索出所述自然语言问题的答案,包括:在所述意图分类结果属于所述第一意图类型的情况下,采用知识图谱检索方式从知识图谱中检索出所述自然语言问题的答案;在所述意图分类结果属于所述第二意图类型的情况下,采用问答库检索方式从问答库中检索出所述自然语言问题的答案。3.根据权利要求2所述的方法,其特征在于,所述采用知识图谱检索方式从知识图谱中检索出所述自然语言问题的答案,包括:识别所述自然语言问题中包含的至少一个命名实体;从所述知识图谱中确定出各个所述命名实体分别对应的实体节点;基于各个所述命名实体分别对应的实体节点,从所述知识图谱中检索出所述自然语言问题的答案。4.根据权利要求3所述的方法,其特征在于,所述从所述知识图谱中确定出各个所述命名实体分别对应的实体节点,包括:对于所述至少一个命名实体中的目标命名实体,根据所述目标命名实体的特征信息与所述知识图谱中的各个实体节点的特征信息,分别计算所述目标命名实体与每个实体节点之间的综合相似度;其中,所述特征信息包括以下至少之一:字面特征、语义特征和知识特征,所述字面特征用于表征组成实体的字符串,所述语义特征用于表征实体的语义词向量,所述知识特征用于表征实体在所述知识图谱下的表示向量;将与所述目标命名实体之间的综合相似度最大的实体节点,确定为所述目标命名实体对应的实体节点。5.根据权利要求4所述的方法,其特征在于,所述根据各个所述命名实体中的目标命名实体的表示特征与所述知识图谱中的各个实体节点的表示特征,计算所述目标命名实体与所述各个实体节点之间的综合相似度,包括:根据所述目标命名实体的字面特征与所述各个实体节点中的目标实体节点的字面特征,计算得到所述目标命名实体与所述目标实体节点之间的编辑距离;根据所述目标命名实体的语义特征与所述目标实体节点的语义特征,计算得到所述目标命名实体与所述目标实体节点之间的第一余弦相似度;2CN114281951A权利要求书2/4页根据所述目标命名实体的知识特征与所述目标实体节点的知识特征,计算得到所述目标命名实体与所述目标实体节点之间的第二余弦相似度;基于所述目标命名实体与所述目标实体节点之间的编辑距离、第一余弦相似度和第二余弦相似度,确定所述目标命名实体与所述目标实体节点之间的综合相似度。6.根据权利要求3所述的方法,其特征在于,所述基于各个所述命名实体分别对应的实体节点,从所述知识图谱中检索出所述自然语言问题的答案,包括:获取各个所