预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN116010566A(43)申请公布日2023.04.25(21)申请号202211629271.4G06F16/33(2019.01)(22)申请日2022.12.19G06F16/35(2019.01)G06N3/0442(2023.01)(71)申请人之江实验室G06N3/0464(2023.01)地址311100浙江省杭州市余杭区之江实G10L15/26(2006.01)验室南湖总部G10L13/08(2013.01)(72)发明人朱世强任杰宋伟顾建军龙沁沁赵文宇徐泽民(74)专利代理机构杭州天勤知识产权代理有限公司33224专利代理师曹兆霞(51)Int.Cl.G06F16/332(2019.01)G06F16/36(2019.01)G06F40/30(2020.01)G06F16/338(2019.01)权利要求书2页说明书6页附图2页(54)发明名称一种基于知识图谱的问答方法和系统(57)摘要本发明公开了一种基于知识图谱的问答方法和系统,包括:将获取的音频数据转换为问答文本;利用基于双向LSTM构建的主语判断模型对问答文本进行主语判断并确认主语;采用基于spacy框架并结合主语在问答文本中的前后语义特征,链接主语在知识图谱中的标准主语实体;利用基于CNN构建关系预测模型对问答文本进行关系判断并筛选概率值高的至少2个关系;依据标准主语实体和每个关系在知识图谱中进行检索,确定每个目标实体节点,并对所有目标实体节点排序确认最终目标实体节点作为答案,并将答案转换成语音输出。该方法和系统实现计算资源需求最小化。CN116010566ACN116010566A权利要求书1/2页1.一种基于知识图谱的问答方法,其特征在于,所述问答方法应用在导览机器人中,所述问答方法包括以下步骤:将获取的音频数据转换为问答文本;利用基于双向LSTM构建的主语判断模型对问答文本进行主语判断并确认主语;采用基于spacy框架并结合主语在问答文本中的前后语义特征,链接主语在知识图谱中的标准主语实体;利用基于CNN构建关系预测模型对问答文本进行关系判断并筛选概率值高的至少2个关系;依据标准主语实体和每个关系在知识图谱中进行检索,确定每个目标实体节点,并对所有目标实体节点排序确认最终目标实体节点作为答案,并将答案转换成语音输出。2.根据权利要求1所述的基于知识图谱的问答方法,其特征在于,所述主语判断模型包括双向LSTM、分类单元,双向LSTM用于提取问答文本中每个词语的隐含向量,分类单元用于根据隐含向量进行主语的判断得到概率值。3.根据权利要求1所述的基于知识图谱的问答方法,其特征在于,所述问答文本在输入主语判断模型之前,经过问答文本的分词、分词得到词语的向量初始化。4.根据权利要求2所述的基于知识图谱的问答方法,其特征在于,所述分类单元采用神经网络,包括线性层和激活层,激活层采用log_softmax函数对每个词语对应的隐含向量进行激活以计算概率值。5.根据权利要求1所述的基于知识图谱的问答方法,其特征在于,所述关系预测模型包括至少3层卷积层的CNN、池化层和激活层,CNN用于提取问答文本的特征,池化层用于对特征进行池化操作,激活层用于对池化操作后的特征进行激活预测以得到关系的预测概率值。6.根据权利要求1所述的基于知识图谱的问答方法,其特征在于,所述依据标准主语实体和每个关系在知识图谱中进行检索,包括:将标准主语实体与每个关系拼接成sparql查询语句,基于该sparql查询语句在知识图谱中搜索,得到每个目标实体节点。7.一种基于知识图谱的问答系统,其特征在于,所述问答方法应用在导览机器人中,所述问答系统包括:文本转换模块,用于将获取的音频数据转换为问答文本;主语确认模块,用于利用基于双向LSTM构建的主语判断模型对问答文本进行主语判断并确认主语;链接确认模块,用于采用基于spacy框架并结合主语在问答文本中的前后语义特征,链接主语在知识图谱中的标准主语实体;关系确认模块,用于利用基于CNN构建关系预测模型对问答文本进行关系判断并筛选概率值高的至少2个关系;检索模块,用于依据标准主语实体和每个关系在知识图谱中进行检索,确定每个目标实体节点,并对所有目标实体节点排序确认最终目标实体节点作为答案;输出模块,用于将答案转换成语音输出。8.根据权利要求7所述的基于知识图谱的问答系统,其特征在于,所述主语判断模型包2CN116010566A权利要求书2/2页括双向LSTM、分类单元,双向LSTM用于提取问答文本中每个词语的隐含向量,分类单元用于根据隐含向量进行主语的判断得到概率值。9.根据权利要求8所述的基于知识图谱的问答系统,其特征在于,所述分类单元采用神经网络,包括线性层和激活层,激活层采用l