预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105989839A(43)申请公布日2016.10.05(21)申请号201510298789.8(22)申请日2015.06.03(71)申请人乐视致新电子科技(天津)有限公司地址300467天津市滨海新区生态城动漫中路126号动漫大厦B1区二层201-427(72)发明人王育军(74)专利代理机构北京国昊天诚知识产权代理有限公司11315代理人刘戈(51)Int.Cl.G10L15/14(2006.01)G10L15/02(2006.01)权利要求书3页说明书8页附图3页(54)发明名称语音识别方法和装置(57)摘要本发明公开了一种语音识别方法和装置,该方法和装置通过在语音信号中提取多个语音数据包,对每个语音数据包进行语音识别,并根据前一语音数据包的语速来生成后一语音数据包的语音识别过程所需提取语音特征向量的数量,无需获取完整的语音信号即可实现根据语音信号的语速变化来调整语音识别进程,使得语音识别效率和准确性均达到很高水准。CN105989839ACN105989839A权利要求书1/3页1.一种语音识别方法,其特征在于,包括:获取语音信号,在所述语音信号中提取多个语音数据包,所述多个语音数据包内包括在时间上连续的第一语音数据包和第二语音数据包;从所述第一语音数据包中提取第一数量的第一语音特征向量;根据各第一语音特征向量与预设的马尔科夫声学模型,确定所述第一语音数据包的第一语音语速;根据所述第一语音语速与标准语音语速,确定第二数量;从所述第二语音数据包提取第二数量的第二语音特征向量;根据所述第二语音特征向量与预设马尔科夫声学模型,确定第二语音数据包的第二识别结果。2.根据权利要求1所述的语音识别方法,其特征在于,根据各第一语音特征向量与预设的马尔科夫声学模型,确定所述第一语音数据包的第一语音语速,具体包括:将各第一语音特征向量与预设马尔科夫声学模型做比对,得到每个第一语音特征向量的第一识别子结果和每个第一识别子结果的参考概率值;获取各第一语音特征向量的第一识别子结果的数量上的收敛时刻,得到位于所述收敛时刻的第一语音特征向量,作为第一收敛特征向量;获取最晚收敛时刻上的第一收敛特征向量中参考概率值最大的第一识别子结果;根据马尔科夫声学模型对所述参考概率值最大的第一识别子结果做回溯,得到第一最优识别路径;获取所述第一最优识别路径的跳转概率;根据所述第一最优识别路径的跳转概率和所述第一语音数据包的时长得到第一语音语速。3.根据权利要求2所述的语音识别方法,其特征在于,所述第一收敛特征向量中第一识别子结果的数量小于前一、后一第一语音特征向量中第一识别子结果的数量。4.根据权利要求3所述的语音识别方法,其特征在于,获取所述第一语音特征向量的第一识别子结果的数量上的收敛时刻之前,所述语音识别方法还包括:仅保留每个第一语音特征向量中参考概率值大于预设概率阈值的第一识别子结果。5.根据权利要求2述的语音识别方法,其特征在于,根据马尔科夫声学模型对所述参考概率值最大的第一识别子结果做回溯,得到第一最优识别路径,具体包括:以所述参考概率值最大的第一识别子结果为基准,根据马尔科夫声学模型得到跳转至所述第一识别子结果的参考概率值最大的前一第一语音特征向量的第一识别子结果;以第一识别子结果为基准,根据马尔科夫声学模型得到所述第一识别子结果跳转的参考概率值最大的后一第一语音特征向量的第一识别子结果;判断是否已经得到所有第一语音特征向量的第一识别子结果;将得到所有第一语音特征向量的第一识别子结果做汇总,作为第一最优识别路径。6.根据权利要求1所述的语音识别方法,其特征在于,根据所述第一语音语速与标准语音语速,确定第二数量,具体包括:将第一语音语速和标准语音语速的比值与所述第一数量作乘积的结果,作为第二数量。2CN105989839A权利要求书2/3页7.根据权利要求1所述的语音识别方法,其特征在于,从所述第二语音数据包提取第二数量的第二语音特征向量,具体包括:获取相邻第一语音特征向量之间的第一帧移;根据所述第二数量和第一数量调整所述第一帧移,得到第二帧移;根据所述第二帧移,从所述第二语音数据包提取第二语音特征向量,以使得所述第二语音特征向量的数量为第二数量。8.根据权利要求1所述的语音识别方法,其特征在于,从所述第二语音数据包提取第二数量的第二语音特征向量,具体包括:从所述第二语音数据包中提取第一数量的第二语音特征向量;在相邻的第二语音特征向量之间提取特定数量的第二语音特征向量,将所述第二语音特征向量的数量调整为第二数量。9.根据权利要求1所述的语音识别方法,其特征在于,将所述第二语音特征向量与预设马尔科夫声学模型做比对,得到第二语音数据包的第二识别结果之前,所述语音识别方法