预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN108897723A(43)申请公布日2018.11.27(21)申请号201810716111.0(22)申请日2018.06.29(71)申请人北京百度网讯科技有限公司地址100085北京市海淀区上地十街10号百度大厦2层(72)发明人曹宇慧冯仕堃何径舟(74)专利代理机构北京市铸成律师事务所11313代理人王珺武晨燕(51)Int.Cl.G06F17/22(2006.01)G06F17/27(2006.01)G06F17/30(2006.01)G06N3/08(2006.01)权利要求书2页说明书7页附图3页(54)发明名称场景对话文本识别方法、装置以及终端(57)摘要本发明提出一种场景对话文本识别方法、装置以及终端。其中,该方法包括:将场景对话文本输入至长短记忆型递归神经网络模型中,得到对话语义连贯特征分数;将场景对话文本输入至特征抽取器中,生成对话特征参量;将对话语义连贯特征分数和对话特征参量输入至梯度提升数融合模型中,得到优质交互的概率值;如果优质交互的概率值大于优质交互阈值时,则场景对话文本是优质交互文本。有效的挖掘了场景对话文本中的语义信息,并将语义信息和其它的对话特征参量融合在一起,对场景对话文本进行识别,给多轮对话的场景对话文本打上优质或者非优质的标签。CN108897723ACN108897723A权利要求书1/2页1.一种场景对话文本识别方法,其特征在于,包括:将场景对话文本输入至长短记忆型递归神经网络模型中,得到对话语义连贯特征分数;将所述场景对话文本输入至特征抽取器中,生成对话特征参量;将所述对话语义连贯特征分数和所述对话特征参量输入至梯度提升数融合模型中,得到优质交互的概率值;如果所述优质交互的概率值大于优质交互阈值时,则所述场景对话文本是优质交互文本。2.根据权利要求1所述的方法,其特征在于,将场景对话文本输入至长短记忆型递归神经网络模型中,得到对话语义连贯特征分数,包括:将所述场景对话文本中的每条对话语句进行切词,并将切词后得到的各个分词转化为词向量;将每条所述对话语句包含的所述词向量进行相加,生成与所述对话语句对应的语句特征向量;将各个所述语句特征向量输入至所述长短记忆型递归神经网络层中,生成对话特征向量;将所述对话特征向量输入至全连接层,输出连贯性类别和非连贯性类别;将所述连贯性类别和所述非连贯性类别输入至多类别逻辑回归函数中计算对应的概率值,得到所述对话语义连贯特征分数。3.根据权利要求2所述的方法,其特征在于,按照对所述场景对话文本中的对话顺序将所述语句特征向量输入至所述长短记忆型递归神经网络层中。4.根据权利要求1所述的方法,其特征在于,所述对话特征参量包括多轮对话的轮次、每轮对话中交互次数、回复的文本长度和对话主题实体词中的至少一项。5.根据权利要求1所述的方法,其特征在于,所述长短记忆型递归神经网络模型用于接收所述场景对话文本中的长语句,所述长语句是文本长度大于对话长度阈值的语句。6.一种场景对话文本识别装置,其特征在于,包括:连贯特征分数生成模块,用于将场景对话文本输入至长短记忆型递归神经网络模型中,得到对话语义连贯特征分数;对话特征参量抽取模块,用于将所述场景对话文本输入至特征抽取器中,生成对话特征参量;优质交互概率值模块,用于将所述对话语义连贯特征分数和所述对话特征参量输入至梯度提升数融合模型中,得到优质交互的概率值;优质交互结果判断模块,用于如果所述优质交互的概率值大于优质交互阈值时,则所述场景对话文本是优质交互文本。7.根据权利要求6所述的装置,其特征在于,所述连贯特征分数生成模块包括:词向量转换单元,用于将所述场景对话文本中的每条对话语句进行切词,并将切词后得到的各个分词转化为词向量;词向量相加单元,用于将每条所述对话语句包含的所述词向量进行相加,生成与所述对话语句对应的语句特征向量;2CN108897723A权利要求书2/2页对话特征提取单元,用于将各个所述语句特征向量输入至所述长短记忆型递归神经网络层中,生成对话特征向量;全连接计算单元,用于将所述对话特征向量输入至全连接层,输出连贯性类别和非连贯性类别;特征分数计算单元,用于将所述连贯性类别和所述非连贯性类别输入至多类别逻辑回归函数中计算对应的概率值,得到所述对话语义连贯特征分数。8.一种场景对话文本识别终端,其特征在于,包括:一个或多个处理器;存储器,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。9.一种计算机可读存储介质,其存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-5中任一所述的方法。3CN108897723A说明书1