预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105869629A(43)申请公布日2016.08.17(21)申请号201610192862.8(22)申请日2016.03.30(71)申请人乐视控股(北京)有限公司地址100025北京市朝阳区姚家园105号3号楼10层1102申请人乐视致新电子科技(天津)有限公司(72)发明人王育军(74)专利代理机构北京国昊天诚知识产权代理有限公司11315代理人刘戈(51)Int.Cl.G10L15/06(2013.01)权利要求书2页说明书8页附图2页(54)发明名称语音识别方法及装置(57)摘要本发明实施例提供一种语音识别方法及装置,包括:获取语音信号对应的候选词串;调用领域语言模型,确定所述候选词串在领域语言模型中对应的概率增强系数;调用基本语言模型,确定所述候选词串在基本语言模型中的基本匹配概率;将所述概率增强系数结合所述基本匹配概率获得所述候选词串的总匹配概率;根据各候选词串的总匹配概率,计算各候选词串组成的词序列的概率,并根据概率最高的词序列生成所述语音信号对应的语言文本。本发明实施例提供的语音识别方法及装置,综合考虑了基本语言模型中的通用说话习惯,又兼顾了领域语言模型中的特定用词习惯,从而可对语音信号提供更高的识别率。CN105869629ACN105869629A权利要求书1/2页1.一种语音识别方法,其特征在于,包括:获取语音信号对应的候选词串;调用领域语言模型,确定所述候选词串在领域语言模型中对应的概率增强系数;调用基本语言模型,确定所述候选词串在基本语言模型中的基本匹配概率;将所述概率增强系数结合所述基本匹配概率获得所述候选词串的总匹配概率;根据各候选词串的总匹配概率,计算各候选词串组成的词序列的概率,并根据概率最高的词序列生成所述语音信号对应的语言文本。2.根据权利要求1所述的方法,其特征在于,所述确定所述候选词串在领域语言模型中对应的增强系数,包括:根据所述候选词串在所述基本语言模型中对应的多个基本匹配概率,确定所述候选词串在所述基本语言模型中对应的第一匹配概率范围;根据所述候选词串在所述领域语言模型中对应的多个匹配概率,确定所述候选词串在所述领域语言模型中对应的第二匹配概率范围;根据所述候选词串在所述基本语言模型中对应的第一匹配概率范围和所述领域语言模型中对应的第二匹配概率范围的分差比值,获得所述候选词串在所述领域语言模型中对应的增强系数。3.根据权利要求2所述的方法,其特征在于,所述确定所述候选词串在领域语言模型中概率对应的增强系数,包括:查询所述候选词串包含的N元词组是否出现在所述领域语言模型中,如果未出现,则生成对应的惩罚概率,并查询所述候选词串包含的N-i元词组是否出现在所述领域语言模型中,如果所述N-i元词组出现在所述领域语言模型中,则根据所述N-i元词组在所述领域语言模型中的匹配概率与i倍的惩罚概率获得所述候选词串在所述领域语言模型中的匹配概率,并根据所述候选词串在所述领域语言模型中的匹配概率获得所述候选词串在所述领域语言模型中对应的增强系数;其中,N和i为整数,且i<N。4.根据权利要求1或2所述的方法,其特征在于,如果所述候选词串包含的1~N元词组均未出现在所述领域语言模型中,则将所述基本匹配概率作为所述候选词串的总匹配概率。5.根据权利要求1所述的方法,其特征在于,所述调用领域语言模型,包括:识别语音信号携带的标识号;根据所述标识号查找匹配的领域语言模型;其中,所述标识号包括语音信号的来源产品标识号、通过语义解析获取的语音信号的领域标识号、用户的账号中的一种或多种。6.一种语音识别装置,其特征在于,包括:意向分析模块,用于获取语音信号对应的候选词串;第一识别模块,用于调用领域语言模型,确定所述候选词串在领域语言模型中对应的增强系数;第二识别模块,用于调用基本语言模型,确定所述候选词串在基本语言模型中的基本匹配概率;2CN105869629A权利要求书2/2页加值模块,用于将所述增强系数结合所述基本匹配概率获得所述候选词串的总匹配概率;识别结果生成模块,用于根据各候选词串的总匹配概率,计算各候选词串组成的词序列的概率,并根据概率最高的词序列生成所述语音信号对应的语言文本。7.根据权利要求6所述的装置,其特征在于,所述第一识别模块,用于:根据所述候选词串在所述基本语言模型中对应的一个或多个基本匹配概率,确定所述候选词串在所述基本语言模型中对应的第一匹配概率范围;根据所述候选词串在所述领域语言模型中对应的一个或多个匹配概率,确定所述候选词串在所述领域语言模型中对应的第二匹配概率范围;根据所述候选词串在所述基本语言模型中对应的第一匹配概率范围和所述领域语言模型中对应的第二匹配概率范围的分差比值,获得所述候选词串在所述