语音识别方法、装置、设备、存储介质和计算机程序产品-豆柴文库

语音识别方法、装置、设备、存储介质和计算机程序产品.pdf

2023-07-24

10金币

381KB

13页

景山****魔王

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共13页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114255761A(43)申请公布日2022.03.29(21)申请号202111535270.9(22)申请日2021.12.15(71)申请人北京声智科技有限公司地址100094北京市海淀区北清路81号院一区1号楼6层601(72)发明人陈孝良李良斌(74)专利代理机构北京东方亿思知识产权代理有限责任公司11258代理人陈思凡(51)Int.Cl.G10L15/26(2006.01)G10L15/06(2013.01)G10L15/22(2006.01)权利要求书2页说明书9页附图1页(54)发明名称语音识别方法、装置、设备、存储介质和计算机程序产品(57)摘要本申请公开了一种语音识别方法、装置、设备、存储介质和计算机程序产品。本申请实施例提供的语音识别方法包括：获取待识别的第一语音；根据目标语音识别模型，确定待识别的第一语音对应的第一文本信息，其中，目标语音识别模型是通过目标词集对训练好的初始语音识别模型更新得到的，目标词集包括在预设时间段内初始语音识别模型未识别的第一关键词和/或未识别的第一关键词组合。根据本申请实施例，能够解决语音识别系统识别效率和识别准确率相对较低，影响用户使用体验的问题。CN114255761ACN114255761A权利要求书1/2页1.一种语音识别方法，其特征在于，所述方法包括：获取待识别的第一语音；根据目标语音识别模型，确定所述待识别的第一语音对应的第一文本信息，其中，所述目标语音识别模型是通过目标词集对训练好的初始语音识别模型更新得到的，所述目标词集包括在预设时间段内所述初始语音识别模型未识别的第一关键词和/或未识别的第一关键词组合。2.根据权利要求1所述的方法，其特征在于，在所述根据目标语音识别模型，确定所述待识别的第一语音对应的第一文本信息之前，所述方法还包括：获取待识别的第二语音；在所述预设时间段内，根据所述初始语音识别模型，确定所述第二语音对应的第二文本信息，其中，所述第二文本信息中包括第二关键词组合，所述第二关键词组合包括多个第二关键词；根据所述初始语音模型对所述第二文本信息中每个所述第二关键词的识别概率，确定所述初始语音识别模型对所述第二文本信息的第一识别概率；在所述第一识别概率小于第一预设阈值的情况下，将所述第二关键词组合确定为所述第一关键词组合，以及将所述第二关键词组合加入所述目标词集。3.根据权利要求2所述的方法，其特征在于，所述在所述第一识别概率小于第一预设阈值的情况下，将所述第二关键词组合确定为所述第一关键词组合，包括：获取所述预设时间段内，对所述第二语音的识别频率；在所述识别频率大于第二预设阈值，且所述第一识别概率小于所述第一预设阈值的情况下，将所述第二关键词组合确定为所述第一关键词组合。4.根据权利要求1所述的方法，其特征在于，在所述根据目标语音识别模型，确定所述待识别语音对应的文本信息之前，所述方法还包括：获取待识别的第三语音；在所述预设时间段内，根据所述初始语音识别模型，确定所述第三语音对应的第三文本信息，其中，所述第三文本信息包括第三关键词；根据所述初始语音模型对所述第三关键词中每个文字的识别概率，确定所述初始语音识别模型对所述第三关键词的第二识别概率；在所述第二识别概率小于第三预设阈值的情况下，将所述第三关键词确定为所述未识别的第一关键词，将所述未识别的第一关键词加入所述目标词集。5.根据权利要求1所述的方法，其特征在于，在所述根据目标语音识别模型，确定所述待识别的第一语音对应的第一文本信息之前，所述方法包括：在所述目标词集满足预设更新条件的情况下，获取所述目标词集中每个第一文本信息的音素信息；根据每个第一文本信息的音素信息，更新所述初始语音识别模型中的发音词典，得到所述目标语音识别模型。6.一种语音识别装置，其特征在于，所述装置包括：获取模块，用于获取待识别的第一语音；处理模块，用于根据目标语音识别模型，确定所述待识别的第一语音对应的第一文本2CN114255761A权利要求书2/2页信息，其中，所述目标语音识别模型是通过目标词集对训练好的初始语音识别模型更新得到的，所述目标词集包括在预设时间段内所述初始语音识别模型未识别的第一关键词和/或未识别的第一关键词组合。7.根据权利要求6所述的装置，其特征在于，所述获取模块，还用于获取待识别的第二语音；所述处理模块，还用于在所述预设时间段内，根据所述初始语音识别模型，确定所述第二语音对应的第二文本信息，其中，所述第二文本信息中包括第二关键词组合，所述第二关键词组合包括多个第二关键词；所述处理模块，还用于根据所述初始语音模型对所述第二文本信息中每个所述第二关键词的识别概率，确定所述初始语音识别模型对所述第二文本信息的第一识别概率；所述

相关资料

语音识别方法、装置、设备、存储介质和计算机程序产品.pdf

本申请公开了一种语音识别方法、装置、设备、存储介质和计算机程序产品。本申请实施例提供的语音识别方法包括：获取待识别的第一语音；根据目标语音识别模型，确定待识别的第一语音对应的第一文本信息，其中，目标语音识别模型是通过目标词集对训练好的初始语音识别模型更新得到的，目标词集包括在预设时间段内初始语音识别模型未识别的第一关键词和/或未识别的第一关键词组合。根据本申请实施例，能够解决语音识别系统识别效率和识别准确率相对较低，影响用户使用体验的问题。

2023-07-24

381KB

语音识别方法、装置及计算机设备、存储介质及程序产品.pdf

本发明提出一种语音识别方法及其装置，该方法包括：对待识别的音频进行特征提取，得到音频的特征序列，对特征序列进行过切分处理，得到音频的多个候选切分边界和多个子特征序列；根据候选切分边界和子特征序列构建识别图；其中，识别图中的每条识别路径包括至少一个候选声学单元；每个候选声学单元是由至少一个子特征序列连续拼接形成的；利用声学模型识别所述识别图中的候选声学单元，并结合语言模型对识别图进行解码，获取识别图中符合识别策略的识别路径对应的识别结果作为音频的目标识别文本。由过切分将特征序列切分成一个相对大粒度真实有意义

2024-01-04

1MB

语音识别方法、装置、设备、可读存储介质及计算机程序.pdf

本申请公开了一种语音识别方法、装置、设备、可读存储介质及计算机程序，属于计算机技术领域。通过本申请实施例提供的技术方案，获取语音数据；调用声纹识别模型，对该语音数据和语音特征集进行处理，以确定与该语音数据匹配的目标用户，语音特征集中存储有多个用户的历史语音特征；在对该语音数据进行解码的过程中，调用与目标用户匹配的目标语言模型对该语音数据进行处理，以得到该语音数据对应的目标文本，其中，目标语言模型基于目标用户的历史文本数据训练得到；输出该语音数据对应的目标文本。该技术方案能够提高语音识别的准确率。

2023-07-24

689KB

语音增强方法、装置、设备、存储介质和程序产品.pdf

本申请涉及一种语音增强方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括：获取目标语音数据并确定语音增强模型，语音增强模型包括第一增强模型和第二增强模型；将目标语音数据输入至第一增强模型，得到第一增强模型输出的说话者信息；根据目标语音数据、说话者信息以及第二增强模型，获取目标语音数据对应的增强语音数据。采用本方法能够提高语音质量。

2023-07-21

776KB

语音转换方法、装置、设备、存储介质和程序产品.pdf

本申请涉及一种语音转换方法、装置、设备、存储介质和程序产品。所述方法包括：获取待转换语音数据对应的原始语义特征；通过对齐信息将所述原始语义特征对应的语音长度进行调整，获得目标语义特征；所述对齐信息为根据多个原始语义特征和对应的标准语义特征之间的映射关系生成；通过所述目标语义特征确定所述待转换语音数据转换后的目标语音数据。采用本方法能够加快语音转换速度。

2023-07-24

703KB