预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105895082A(43)申请公布日2016.08.24(21)申请号201610371452.XH04N21/422(2011.01)(22)申请日2016.05.30(71)申请人乐视控股(北京)有限公司地址100025北京市朝阳区姚家园105号3号楼10层1102申请人乐视致新电子科技(天津)有限公司(72)发明人那兴宇(74)专利代理机构北京国昊天诚知识产权代理有限公司11315代理人许志勇(51)Int.Cl.G10L15/02(2006.01)G10L15/20(2006.01)G10L15/30(2013.01)H04N21/41(2011.01)权利要求书5页说明书11页附图3页(54)发明名称声学模型训练方法、语音识别方法及装置(57)摘要本发明实施例提供一种声学模型训练、语音识别方法及装置。包括:对训练语料对应的子带进行时域扩展得到特征矩阵;将所述特征矩阵通过预设的卷积器,获得第一向量;根据所述第一向量与预设的隐藏层权重矩阵获得N维向量;其中,N为所述声学模型的分类数目;根据所述N维向量对所述卷积器与所述隐藏层权重矩阵进行参数更新,以所述参数更新后的所述卷积器与所述隐藏层权重矩阵作为所述声学模型。改善了声学模型,提高了声学打分的正确率。CN105895082ACN105895082A权利要求书1/5页1.一种声学模型训练方法,其特征在于,包括:对训练语料对应的子带进行时域扩展得到特征矩阵;将所述特征矩阵通过预设的卷积器,获得第一向量;根据所述第一向量与预设的隐藏层权重矩阵获得N维向量;其中,N为所述声学模型的分类数目;根据所述N维向量对所述卷积器与所述隐藏层权重矩阵进行参数更新,以所述参数更新后的所述卷积器与所述隐藏层权重矩阵作为所述声学模型。2.根据权利要求1所述的方法,其特征在于,所述方法还包括,采用如下方法获得所述训练语料对应的所述子带:对所述训练语料进行分帧,并对所述分帧得到的语音信号帧进行快速傅里叶变换;对所述快速傅里叶变换的结果取幅度值,采用预设的滤波器从所述幅度值中获取第一预设数量的滤波器组参数;根据预设的子带宽度,对所述滤波器组参数进行分组,得到所述训练语料中每一语音信号帧对应的所述子带;其中,每一语音信号帧对应的所述子带的数量与所述分组的组数相同。3.根据权利要求2所述的方法,其特征在于,所述时域拓展,包括:获取所述语音信号帧的第二预设数量的前向语音信号帧、以及所述语音信号帧的第三预设数量的后向语音信号帧,从而得到所述语音信号帧对应的所述时域拓展后的所述子带;其中,所述第二预设数量以及所述第三预设数量的值为小于所述子带宽度的经验值;其中所述时域拓展后的子带宽度为所述子带宽度与所述第二预设数量以及所述第三预设数量的和。4.根据权利要求3所述的方法,其特征在于,所述卷积器由预设的卷积矩阵组成,所述卷积矩阵具体为:随机初始化得到m×n的矩阵,其中m为所述时域拓展后的子带宽度,n为小于所述子带宽度的经验值;所述预设的隐藏层权重矩阵,具体为:随机初始化x×N的矩阵,其中x为所述分组的组数的倍数,N为所述声学模型的分类数目。5.根据权利要求4所述的方法,其特征在于,所述获得第一向量,包括:以第四预设数量的所述卷积矩阵为一组卷积器,并使用每组所述卷积器与所述特征矩阵做卷积运算;对所述卷积运算的结果进行采样并对所述采样结果进行归一化处理,得到所述第一向量。6.根据权利要求1所述的方法,其特征在于,根据所述第一向量与预设的隐藏层权重矩阵获得N维向量,包括:以所述预设的隐藏层权重矩阵与所述第一向量相乘,并对所述相乘的结果进行规整,获得所述N维向量。7.根据权利要求1所述的方法,其特征在于,对所述卷积器与所述第二向量进行参数更新,包括:步骤a:以所述卷积矩器与所述隐藏层权重矩阵组成矩阵组;2CN105895082A权利要求书2/5页步骤b:根据预设的第一迭代次数以及预设的参数更新策略,对所述矩阵组进行参数迭代更新;步骤c:在所述卷积器之后添加新的隐藏层权重矩阵与预设的非线性函数从而更新所述矩阵组,并根据所述预设的第二迭代次数以及所述预设的参数更新策略对所述矩阵组进行参数更新。8.根据权利要求7所述的方法,其特征在于,所述方法还包括:重复执行步骤c;其中,所述重复执行的次数由所述训练语料的数量决定。9.根据权利要求7或8所述的方法,其特征在于,所述方法还包括:当所述第二迭代次数达到预设的阈值,保持所述卷积矩阵的参数不变,修改所述参数更新的设置,并对所述矩阵组中除所述卷积矩阵之外的其他矩阵进行所述参数更新。10.根据权利要求1所述的方法,其特征在于,所述方法还包括,对训练语料对应的子带进行时域扩展之前,所述方法还包括:根据所述声学模型的