语音识别方法及装置-豆柴文库

语音识别方法及装置.pdf

2023-12-07

10金币

747KB

13页

曾琪****是我

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共13页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105869629A(43)申请公布日2016.08.17(21)申请号201610192862.8(22)申请日2016.03.30(71)申请人乐视控股（北京）有限公司地址100025北京市朝阳区姚家园105号3号楼10层1102申请人乐视致新电子科技（天津）有限公司(72)发明人王育军(74)专利代理机构北京国昊天诚知识产权代理有限公司11315代理人刘戈(51)Int.Cl.G10L15/06(2013.01)权利要求书2页说明书8页附图2页(54)发明名称语音识别方法及装置(57)摘要本发明实施例提供一种语音识别方法及装置，包括：获取语音信号对应的候选词串；调用领域语言模型，确定所述候选词串在领域语言模型中对应的概率增强系数；调用基本语言模型，确定所述候选词串在基本语言模型中的基本匹配概率；将所述概率增强系数结合所述基本匹配概率获得所述候选词串的总匹配概率；根据各候选词串的总匹配概率，计算各候选词串组成的词序列的概率，并根据概率最高的词序列生成所述语音信号对应的语言文本。本发明实施例提供的语音识别方法及装置，综合考虑了基本语言模型中的通用说话习惯，又兼顾了领域语言模型中的特定用词习惯，从而可对语音信号提供更高的识别率。CN105869629ACN105869629A权利要求书1/2页1.一种语音识别方法，其特征在于，包括：获取语音信号对应的候选词串；调用领域语言模型，确定所述候选词串在领域语言模型中对应的概率增强系数；调用基本语言模型，确定所述候选词串在基本语言模型中的基本匹配概率；将所述概率增强系数结合所述基本匹配概率获得所述候选词串的总匹配概率；根据各候选词串的总匹配概率，计算各候选词串组成的词序列的概率，并根据概率最高的词序列生成所述语音信号对应的语言文本。2.根据权利要求1所述的方法，其特征在于，所述确定所述候选词串在领域语言模型中对应的增强系数，包括：根据所述候选词串在所述基本语言模型中对应的多个基本匹配概率，确定所述候选词串在所述基本语言模型中对应的第一匹配概率范围；根据所述候选词串在所述领域语言模型中对应的多个匹配概率，确定所述候选词串在所述领域语言模型中对应的第二匹配概率范围；根据所述候选词串在所述基本语言模型中对应的第一匹配概率范围和所述领域语言模型中对应的第二匹配概率范围的分差比值，获得所述候选词串在所述领域语言模型中对应的增强系数。3.根据权利要求2所述的方法，其特征在于，所述确定所述候选词串在领域语言模型中概率对应的增强系数，包括：查询所述候选词串包含的N元词组是否出现在所述领域语言模型中，如果未出现，则生成对应的惩罚概率，并查询所述候选词串包含的N-i元词组是否出现在所述领域语言模型中，如果所述N-i元词组出现在所述领域语言模型中，则根据所述N-i元词组在所述领域语言模型中的匹配概率与i倍的惩罚概率获得所述候选词串在所述领域语言模型中的匹配概率，并根据所述候选词串在所述领域语言模型中的匹配概率获得所述候选词串在所述领域语言模型中对应的增强系数；其中，N和i为整数，且i<N。4.根据权利要求1或2所述的方法，其特征在于，如果所述候选词串包含的1～N元词组均未出现在所述领域语言模型中，则将所述基本匹配概率作为所述候选词串的总匹配概率。5.根据权利要求1所述的方法，其特征在于，所述调用领域语言模型，包括：识别语音信号携带的标识号；根据所述标识号查找匹配的领域语言模型；其中，所述标识号包括语音信号的来源产品标识号、通过语义解析获取的语音信号的领域标识号、用户的账号中的一种或多种。6.一种语音识别装置，其特征在于，包括：意向分析模块，用于获取语音信号对应的候选词串；第一识别模块，用于调用领域语言模型，确定所述候选词串在领域语言模型中对应的增强系数；第二识别模块，用于调用基本语言模型，确定所述候选词串在基本语言模型中的基本匹配概率；2CN105869629A权利要求书2/2页加值模块，用于将所述增强系数结合所述基本匹配概率获得所述候选词串的总匹配概率；识别结果生成模块，用于根据各候选词串的总匹配概率，计算各候选词串组成的词序列的概率，并根据概率最高的词序列生成所述语音信号对应的语言文本。7.根据权利要求6所述的装置，其特征在于，所述第一识别模块，用于：根据所述候选词串在所述基本语言模型中对应的一个或多个基本匹配概率，确定所述候选词串在所述基本语言模型中对应的第一匹配概率范围；根据所述候选词串在所述领域语言模型中对应的一个或多个匹配概率，确定所述候选词串在所述领域语言模型中对应的第二匹配概率范围；根据所述候选词串在所述基本语言模型中对应的第一匹配概率范围和所述领域语言模型中对应的第二匹配概率范围的分差比值，获得所述候选词串在所述

相关资料

语音识别方法及装置.pdf

本发明提出一种语音识别方法及装置，其中方法包括：通过获取待识别的语音以及参数信息；所述参数信息包括：当前模式、所述语音的识别序号、内外噪音信息以及方位信息；提取所述语音对应的特征向量；根据所述当前模式、所述识别序号，确定所述语音是否属于单次唤醒多次识别模式中的非首次语音；若所述语音属于单次唤醒多次识别模式中的非首次语音，则根据所述参数信息和所述特征向量，获取语音识别结果、声学判定结果和语义判定结果，根据所述声学判定结果和所述语义判定结果，确定所述语音是否属于音乐领域；若所述语音属于音乐领域，则根据所述语音

2023-12-04

613KB

语音识别方法及装置.pdf

本发明实施例提供一种语音识别方法及装置，包括：获取语音信号对应的候选词串；调用领域语言模型，确定所述候选词串在领域语言模型中对应的概率增强系数；调用基本语言模型，确定所述候选词串在基本语言模型中的基本匹配概率；将所述概率增强系数结合所述基本匹配概率获得所述候选词串的总匹配概率；根据各候选词串的总匹配概率，计算各候选词串组成的词序列的概率，并根据概率最高的词序列生成所述语音信号对应的语言文本。本发明实施例提供的语音识别方法及装置，综合考虑了基本语言模型中的通用说话习惯，又兼顾了领域语言模型中的特定用词习惯，

2023-12-07

747KB

语音识别方法及装置.pdf

本发明实施例提供一种语音识别方法及装置，服务器获得待处理的语音信号后，利用预先部署的增量训练模型对该语音信号进行识别从而得到文本信息。由于增量训练模型是预先采用知识蒸馏的方式，仅利用少量新业务场景的样本对旧业务场景的ASR模型进行训练得到的，使得该增量训练模型既能够适用于新业务场景又能保留旧业务场景的语音信号的识别能力，解决了采用全量数据训练带来的时间成本以及深度迁移学习导致的泛化能力下降的问题。

2023-11-07

954KB

语音识别方法及装置.pdf

本申请实施例提供一种语音识别方法及装置，涉及信息处理技术领域，该方法包括：获取多通道语音文件；将多通道语音文件分离为每个对话人的独立语音子文件；获得每个独立语音子文件的起始时间信息、终止时间信息及对话人标识信息；将每个独立语音子文件识别为文本；生成多通道语音文件的特征信息，该特征信息包括多通道语音文件对应的每个独立语音子文件的文本信息、每个独立语音子文件的起始时间信息和终止时间信息、每个独立语音子文件的排序信息及每个独立语音子文件的对话人标识信息。因此可以从多通道语音文件中分离出每个对话人的文本信息、各文

2023-08-19

1.1MB

语音识别方法及其装置.pdf

本说明书实施例公开了一种自动语音识别方法及其装置，其中，该方法包括：获取待识别语音，对待识别语音进行分割，以生成多个音频切片。将多个音频切片分别发送给多个语音识别方，其中，语音识别方能够生成音频切片对应的文本。分别从每个语音识别方接收音频切片对应的文本，对多个音频切片对应的文本进行文本聚合，以生成待识别语音的识别结果。由此，实现了将待识别语音的音频切片发送给多个语音识别方，由多个语音识别方共同完成待识别语音的识别工作，在语音识别过程中任何语音识别方无法获得全部的待识别语音，从而防止了待识别语音出现泄漏，对

2023-05-25

858KB