预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112259084A(43)申请公布日2021.01.22(21)申请号202010597703.2(22)申请日2020.06.28(71)申请人北京沃东天骏信息技术有限公司地址100176北京市大兴区北京经济技术开发区科创十一街18号院2号楼4层A402室申请人北京京东世纪贸易有限公司(72)发明人吴川隆邓丽萍张超(74)专利代理机构中国贸促会专利商标事务所有限公司11038代理人曹蓓许蓓(51)Int.Cl.G10L15/16(2006.01)G10L15/22(2006.01)权利要求书2页说明书6页附图3页(54)发明名称语音识别方法、装置和存储介质(57)摘要本公开提出一种语音识别方法、装置和存储介质,涉及语音识别技术领域。本公开的一种语音识别方法,包括:根据当前语句的语音信号获取候选lattice;根据当前语句对应的上文文本重置神经网络模型,其中,上文文本为当前语句的前一句或多句的识别文本;通过重置后的神经网络模型对候选lattice重打分,获取重打分lattice;根据重打分lattice确定当前语句的识别文本。通过这样的方法,对当前语句的语音识别能够考虑到上文一句或多句的信息,从而更加充分的利用先验信息,使重打分更加准确,提高语音识别的准确率。CN112259084ACN112259084A权利要求书1/2页1.一种语音识别方法,包括:根据当前语句的语音信号获取候选晶格lattice;根据当前语句对应的上文文本重置神经网络模型,其中,所述上文文本为当前语句的前一句或多句的识别文本,所述神经网络模型为基于带上文文本的语料样本训练生成;通过重置后的所述神经网络模型对所述候选lattice重打分,获取重打分lattice;根据所述重打分lattice确定所述当前语句的识别文本。2.根据权利要求1所述的方法,还包括:将当前语句的识别文本存入缓存区,以便作为后续语句的上文文本。3.根据权利要求2所述的方法,还包括:从所述缓存区获取当前语句对应的上文文本。4.根据权利要求1所述的方法,其中,所述根据当前语句的语音信号获取候选lattice包括:基于声学模型和语言模型对所述语音信号进行一遍解码,获取所述候选lattice。5.根据权利要求1所述的方法,其中,所述根据所述重打分lattice确定所述当前语句的识别文本包括:对所述重打分lattice做声学权重和语言权重分析,获得得分最高的路径的解码结果,作为当前语句的识别文本。6.根据权利要求1所述的方法,其中,所述神经网络模型包括LSTM模型或GRU模型。7.根据权利要求1所述的方法,其中,在所述语音信号为对话的语音信号的情况下,所述当前语句对应的上文文本包括当前语句的前一个发言者的最接近当前语句的发言的语音信号。8.根据权利要求1~7任意一项所述的方法,还包括:利用带上文的样本训练所述神经网络模型,直至损失函数的输出收敛,包括:根据当前样本语句的语音信号获取样本候选lattice;根据当前样本语句对应的上文样本文本重置待训练的神经网络模型,其中,所述上文样本文本为当前样本语句的前一句或多句的样本文本;通过重置后的待训练的神经网络模型对所述样本候选lattice重打分,获取重打分样本lattice,确定所述当前样本语句的识别文本;根据当前样本语句的识别文本和当前样本语句的样本文本确定损失函数的输出。9.一种语音识别装置,包括:解码单元,被配置为根据当前语句的语音信号获取候选晶格lattice;重置单元,被配置为根据当前语句对应的上文文本重置神经网络模型,其中,所述上文文本为当前语句的前一句或多句的识别文本,所述神经网络模型为基于带上文文本的语料样本训练生成;重打分单元,被配置为通过重置后的所述神经网络模型对所述候选lattice重打分,获取重打分lattice;识别单元,被配置为根据所述重打分lattice确定所述当前语句的识别文本。10.根据权利要求9所述的装置,还包括:缓存单元,被配置为将当前语句的识别文本存入缓存区,以便作为后续语句的上文文2CN112259084A权利要求书2/2页本。11.根据权利要求9或10所述的装置,还包括:训练单元,被配置为利用带上文的样本训练所述神经网络模型,直至损失函数的输出收敛。12.一种语音识别装置,包括:存储器;以及耦接至所述存储器的处理器,所述处理器被配置为基于存储在所述存储器的指令执行如权利要求1至8任一项所述的方法。13.一种计算机可读存储介质,其上存储有计算机程序指令,该指令被处理器执行时实现权利要求1至8任意一项所述的方法的步骤。3CN112259084A说明书1/6页语音识别方法、装置和存储介质技术领域[0001]本公开涉及语音识别技术领域,特