预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105679310A(43)申请公布日2016.06.15(21)申请号201510790077.8(22)申请日2015.11.17(71)申请人乐视致新电子科技(天津)有限公司地址300467天津市滨海新区天津生态城动漫中路126号动漫大厦B1区二层201-427(72)发明人王育军赵恒艺(74)专利代理机构北京润泽恒知识产权代理有限公司11319代理人苏培华(51)Int.Cl.G10L15/02(2006.01)G10L15/04(2013.01)权利要求书3页说明书10页附图4页(54)发明名称一种用于语音识别方法及系统(57)摘要本发明实施例公开了一种用于语音识别的方法及系统,包括:从监听的语音信号中截取第一语音片段,对所述第一语音片段进行分析确定能量谱;依据所述能量谱对所述第一语音片段进行特征提取,确定语音特征;依据所述语音特征对所述第一语音片段的能量谱进行分析,截取第二段语音片段;对所述第二段语音片段进行语音识别,得到语音识别结果。通过实施上述方法,解决了现有技术中在离线状态下,识别功能单一、识别率低的问题。CN105679310ACN105679310A权利要求书1/3页1.一种用于语音识别的方法,其特征在于,包括:从监听的语音信号中截取第一语音片段,对所述第一语音片段进行分析确定能量谱;依据所述能量谱对所述第一语音片段进行特征提取,确定语音特征;依据所述语音特征对所述第一语音片段的能量谱进行分析,截取第二段语音片段;对所述第二段语音片段进行语音识别,得到语音识别结果。2.根据权利要求1所述方法,其特征在于,所述从监听的语音信号中截取第一语音片段,包括:监听语音信号,对监听的语音信号的能量值进行检测;依据第一能量阈值与第二能量阈值,确定所述语音信号的起点与终点;其中,第一能量阈值大于第二能量阈值;将起点与终点间的语音信号作为第一语音片段。3.根据权利要求1所述方法,其特征在于,所述依据所述能量谱对所述第一语音片段进行特征提取,确定语音特征,包括:基于第一模型对第一语音片段对应的能量谱进行分析,提取语音识别特征,其中,语音识别特征包括:频倒谱系数MFCC特征、感知线性预测PLP特征、或线性鉴别分析LDA特征;基于第二模型对第一语音片段对应的能量谱进行分析,提取说话人语音特征,其中,说话人语音特征包括:高阶频倒谱系数MFCC特征;将第一语音片段对应的能量谱转换功率谱,分析功率谱得到基频特征。4.根据权利要求1所述方法,其特征在于,所述依据所述语音特征对所述第一语音片段的能量谱进行分析,截取第二段语音片段,包括:依据语音识别特征与基频特征,基于第三模型检测第一语音片段的能量谱,确定静音部分和语音部分;依据所述第一语音片段中的第一个语音部分确定起点;当所述静音部分的时长超过静音阈值时,依据所述静音部分之前的语音部分确定终点;提取起点和终点之间的语音信号生成第二语音片段。5.根据权利要求1所述方法,其特征在于,所述的方法还包括:预先存储各用户的用户语音特征;依据每个用户的用户语音特征构建说用户语音模型,其中,所述用户语音模型用于确定语音信号对应用户。6.根据权利要求5所述方法,其特征在于,对所述第二段语音片段进行语音识别,得到语音识别结果之前,还包括:将说话人语音特征和基频特征输入用户语音模型进行说话人验证;当说话人验证通过时,从所述第二段语音片段中提取唤醒信息,其中,所述唤醒信息包括唤醒词或唤醒意图信息。7.根据权利要求1-6所述的任一方法,其特征在于,得到语音识别结果之后,所述方法还包括:采用预置语义规则对语音识别结果进行语义解析匹配,其中,所述语义解析匹配包括以下至少一种:精确匹配、语义要素匹配和模糊匹配;2CN105679310A权利要求书2/3页对语义解析结果进行场景分析,提取至少一个语义标签;依据语义标签确定操作指令,执行所述操作指令。8.一种用于语音识别的系统,其特征在于,包括:第一截取模块,用于从监听的语音信号中截取第一语音片段,对所述第一语音片段进行分析确定能量谱;特征提取模块,用于依据所述能量谱对所述第一语音片段进行特征提取,确定语音特征;第二截取模块,用于依据所述语音特征对所述第一语音片段的能量谱进行分析,截取第二段语音片段;语音识别模块,用于对所述第二段语音片段进行语音识别,得到语音识别结果。9.根据权利要求8所述系统,其特征在于,所述第一截取模块,包括:监听子模块,用于监听语音信号,对监听的语音信号的能量值进行检测;起点终点确定子模块,用于依据第一能量阈值与第二能量阈值,确定所述语音信号的起点与终点;其中,第一能量阈值大于第二能量阈值;截取子模块,用于将起点与终点间的语音信号作为第一语音片段。10.根据权利要求8所述