预览加载中,请您耐心等待几秒...
1/8
2/8
3/8
4/8
5/8
6/8
7/8
8/8

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106095950A(43)申请公布日2016.11.09(21)申请号201610422829.X(22)申请日2016.06.14(71)申请人中国科学院自动化研究所地址100190北京市海淀区中关村东路95号(72)发明人陶建华杨明浩张珂那燊若阳张大伟高廷丽(74)专利代理机构中科专利商标代理有限责任公司11021代理人钟文芳(51)Int.Cl.G06F17/30(2006.01)权利要求书2页说明书4页附图1页(54)发明名称一种人机对话中教授意图答案生成方法(57)摘要本发明公开了一种人机对话中教授意图答案生成方法,所述方法包括:对于收到的对话,计算其句间相似度,然后对当前对话语句进行对话意图识别;如果当前对话的意图是闲聊意图,则将当前对话及其对应的询问意图值添加至历史记录中,并直接通过搜索知识库或者网络返回答案;如果当前对话的意图是教授意图则进入下一步骤;在所述历史记录中寻找当前对话对应的问句;结合当前对话及网络信息,进行多轮模拟自我对话获取相关答案集合;对于相关答案集合进行过滤;基于每条答案的权重进行摘要抽取,权重值最高的答案作为摘要抽取的结果及当前对话的回答返回。本发明能够对人机对话中教授意图下对用户的教授内容进行良好的反馈,提高人机对话的满意度。CN106095950ACN106095950A权利要求书1/2页1.一种人机对话中教授意图答案生成方法,其特征在于,所述方法包括以下步骤:步骤1,对于收到的对话,计算其句间相似度,然后对当前对话语句进行对话意图识别;步骤2,如果当前对话的意图是闲聊意图,则将当前对话及其对应的询问意图值添加至历史记录中,并直接通过搜索知识库或者网络返回答案;如果当前对话的意图是教授意图,则进入步骤3进行自我对话;步骤3,在确认当前对话的意图是教授意图后,在所述历史记录中寻找当前对话对应的问句;步骤4,根据所述步骤3找到的问句,结合当前对话及网络信息,进行多轮模拟自我对话获取相关答案集合;步骤5,对于所述步骤4获得的相关答案集合进行过滤,去除不相关的答案;步骤6,对于过滤后的答案集合,基于每条答案的权重进行摘要抽取,权重值最高的答案作为摘要抽取的结果,并作为当前对话的回答进行返回。2.根据权利要求1所述的方法,其特征在于,所述步骤1进一步包括以下步骤:步骤11,对于当前对话所包含的句子进行分词操作,得到每个句子的词向量序列,所述词向量序列由每个句子分词后得到的词向量组成;步骤12,基于每个句子的词向量序列,计算句间相似度;步骤13,基于所述句间相似度,采用词向量模型对于当前对话进行对话意图识别,获得当前对话的对话意图。3.根据权利要求2所述的方法,其特征在于,所述步骤12中,采用如下公式计算句间相似度:其中,S(x,y)表示句间相似度,x,y分别表示句子x和句子y的词向量序列。4.根据权利要求2所述的方法,其特征在于,所述对话意图至少包括闲聊意图和教授意图,其中,所述教授意图是指用户对计算机返回答案的纠正,或者用户对计算机答案表达自己的观点。5.根据权利要求1所述的方法,其特征在于,所述询问意图值是指用户对话是问句的概率。6.根据权利要求1所述的方法,其特征在于,所述步骤3中,采用下式在历史记录中寻找当前对话对应的问句:其中,ρi表示第i条历史对话是当前对话语句对应问句的概率值,D(xi,xt)表示第i条历史对话与当前对话之间的距离,xt表示当前对话,xi表示第i条历史对话,Ask(xi)表示第i条历史对话询问意图值的大小,len表示对话历史记录的长度,α,β,γ分别表示权重;S(xi,xt)表示第i条历史对话与当前对话之间的句间相似度。7.根据权利要求1所述的方法,其特征在于,所述步骤4中,采用下式来进行多轮自我对话以获取相关答案集合:ai+1=F(q,ai),0≤i≤n2CN106095950A权利要求书2/2页其中,q表示步骤3找到的当前对话对应的问句,ai表示第i轮自我对话得到的答案,a0表示当前对话,F(q,ai)表示通过问句q和当前答案ai,得到的自我对话下一轮的答案,n为对话的最多轮数。8.根据权利要求1所述的方法,其特征在于,所述步骤5中,采用下式来迭代计算每条答案的权重:其中,W(vj)表示第i条答案的权重,Vj表示第j条答案,vi表示第i条答案,Vk表示第k条答案,In(vi)是指存在指向第i条答案信息的句子集合,Out(vj)是第j条答案所指向的句子集合,S(i,j)及S(j,k)表示两个句子的相似程度。9.根据权利要求1所述的方法,其特征在于,所述步骤5中,当摘要抽取得到的信息数量较多时,采用句间词向量的相似度对得到的信息进行聚类,将相似度较高的一类信息作为摘要抽取的内容。3CN10