一种语音识别方法及语音识别装置-豆柴文库

一种语音识别方法及语音识别装置.pdf

2023-06-11

10金币

285KB

9页

星星****眨眼

实名认证

内容提供者

1/9

2/9

3/9

4/9

5/9

6/9

7/9

8/9

9/9

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115762495A(43)申请公布日2023.03.07(21)申请号202211304736.9G10L17/06(2013.01)(22)申请日2022.10.24G10L17/22(2013.01)(71)申请人深圳市捌零零在线科技有限公司地址518000广东省深圳市福田区香蜜湖街道东海社区香林路28号东海花园1期5栋14D(72)发明人胡世民(74)专利代理机构深圳中恒科专利代理有限公司44808专利代理师王丽(51)Int.Cl.G10L15/08(2006.01)G10L15/26(2013.01)G10L15/02(2006.01)G10L15/00(2006.01)权利要求书2页说明书4页附图2页(54)发明名称一种语音识别方法及语音识别装置(57)摘要本发明公开了一种语音识别方法及识别装置，具体包括以下步骤：S1：进行数据预处理，使用者首先根据其需求创建语音文件，所述语音文件包括语音数据预处理和文本数据预处理，其中所述语音数据预处理用于获取语音文件中的特征数据，所述文本数据预处理用于获取语音文件中的文本内容并提取其中出现的文字创建词典；S2：构建语音识别模型，其中所述语音识别模型基于CTC算法进行语音序列的切分。本发明提供的语音识别方法及语音识别装置具有充分提取语音数据的特征信息，同时该模型结构也采用了判断环境状态的技术，能够进一步简化语音识别的流程，通过上述方法不仅提高了语音识别的准确率，而且也提高了语音识别的效率的技术效果。CN115762495ACN115762495A权利要求书1/2页1.一种语音识别方法，其特征在于，具体包括以下步骤：S1：进行数据预处理，使用者首先根据其需求创建语音文件，所述语音文件包括语音数据预处理和文本数据预处理，其中所述语音数据预处理用于获取语音文件中的特征数据，所述文本数据预处理用于获取语音文件中的文本内容并提取其中出现的文字创建词典；S2：构建语音识别模型，其中所述语音识别模型基于CTC算法进行语音序列的切分；所述语音识别模型基于注意力机制对切分的片段进行识别；S3：获取使用者的身份识别结果；采集使用者的声音信息获取与所述操作者相对应的语音特征参数；进而获得与之相匹配的身份识别结果；S4：获取待识别的语音信号；提取所述语音信号的特征，得到所述语音信号的特征序列；将所述特征序列输入至训练后的语音识别模型中进行语音识别。2.根据权利要求1所述的一种语音识别方法，其特征在于，所述语音识别方法还包括：判断环境状态；以及所述获取操作者的身份识别结果的步骤还包括：根据所述环境状态，获取操作者的身份识别结果。3.根据权利要求1所述的一种语音识别方法，其特征在于，所述语音特征参数包括：声学特征参数、声纹信息参数、语音的音色参数、音高参数、音长参数和音强参数。4.根据权利要求1所述的一种语音识别方法，其特征在于，所述S1步骤中对数据预处理即为对原始语音进行处理：对所述元时运银处理具体包括以下步骤：对所述原始语音进行预加重处理；对所述原始语音进行分帧处理；对所述原始语音进行加窗处理；对所述原始语音进行端点检测处理。5.一种语音识别装置，应用于语音识别模型，其特征在于，包括有语音获取模块、数据处理模块、特征提取模块、识别模块和检测模块，所述语音获取模块用于获取待识别的语音信号；所述特征提取模块，用于提取所述语音信号的特征，得到所述语音信号的特征序列；所述语音识别模块，用于将所述语音信号的特征输入至训练后的语音识别模型，以使得所述训练后的语音识别模型识别所述语音信号，得到所述语音识别模型输出的第一信号，所述第一信号用于表示所述语音信号的文字信息。6.根据权利要求5所述的一种语音识别装置，其特征在于，所述数据处理模块还被配置为：接收所述操作者的语音；向服务器发送所接收的语音；以及从服务器接收与所述操作者相对应的声学特征集，对声音信号进行处理并识别，用于在预设时段内未获得身份识别的结果时，发出身份识别提醒。7.根据权利要求6所述的一种语音识别装置，其特征在于，所述识别模块在根据所述语音特征参数对所述语音信息进行语音识别时，具体用于：获取所述语音信息中的语音特征参数；若获取到的语音特征参数与预设的使用者的语音特征参数相匹配，则根据所述预设的使用者的语音特征参数对所述语音信息进行语音识别。8.根据权利要求7所述的一种语音识别装置，其特征在于，所述检测模块用于检测并分析预设的数据处理模块，以获取使用者的语音特征参数，并将获取到的所述使用者的语音特征参数存储于语音识别模型中。9.根据权利要求7所述的一种语音识别装置，其特征在于，所述检测模块用于根据声学特征参数、声纹信息参数、语音的音色参数、音高参数、音长参数和音强参数或者它们的组合获取使用者

相关资料

一种语音识别方法及语音识别装置.pdf

本发明公开了一种语音识别方法及识别装置，具体包括以下步骤：S1：进行数据预处理，使用者首先根据其需求创建语音文件，所述语音文件包括语音数据预处理和文本数据预处理，其中所述语音数据预处理用于获取语音文件中的特征数据，所述文本数据预处理用于获取语音文件中的文本内容并提取其中出现的文字创建词典；S2：构建语音识别模型，其中所述语音识别模型基于CTC算法进行语音序列的切分。本发明提供的语音识别方法及语音识别装置具有充分提取语音数据的特征信息，同时该模型结构也采用了判断环境状态的技术，能够进一步简化语音识别的流程，

2023-06-11

285KB

一种语音识别方法和语音识别装置.pdf

本申请实施例提供一种语音识别方法和语音识别装置，该方法包括：对语音数据流进行加窗处理，确定位于窗口内的语音数据；对窗口内的语音数据进行对象识别处理，并根据对象识别处理结果对窗口进行长度调整，并将位于调整后的窗口内的语音数据确定为目标语音段；基于识别模型对目标语音段进行语音识别处理，得到目标识别结果。这样，在对语音数据流进行加窗处理时，根据对象识别处理的结果灵活调整窗口长度，以得到不同大小的目标语音段，能够兼顾识别速度和识别效果，从而综合改善端对端语音识别场景的语音识别性能。

2023-07-25

564KB

语音识别装置、语音识别程序和语音识别方法.pdf

本发明的目的在于，提供一种便利性更高的语音识别装置的技术。本发明的语音识别装置的特征在于，具备：存储部，其存储使画面与该画面中的选项对应的画面定义信息和确定每个选项曾被选择的次数的选择履历信息；接触指示接受部，其通过接触的操作接受指示；语音指示接受部，其通过语音的操作接受指示；和选项朗读部，当在规定画面中限制接触指示接受部接受指示时，该选项朗读部将规定画面中的选项以与曾被选择的次数相应的顺序语音输出，语音指示接受部对通过选项朗读部输出的选项中的任一项接受指示。

2023-12-07

2.1MB

一种语音识别模型构建及语音识别方法、装置.pdf

本发明提供了一种语音识别模型构建及语音识别方法、装置，其中，语音识别模型构建方法包括：获取音频数据集；确定音频数据集中每一个音频数据的长度；当任一音频数据的长度大于预设长度则从音频数据中选取预设长度的音频数据作为训练样本，当任一音频数据的长度小于预设长度则将音频数据作为训练样本；对训练样本中的每一音频数据进行特征提取，得到每一个音频数据的目标语音特征并构建得到目标语音特征数据集；利用目标语音特征数据集对目标识别模型进行训练直至训练结果满足预设条件。本发明可解决现有技术中基于整条音频进行训练时速度慢及受静音

2023-06-07

534KB

一种语音识别方法、装置和用于语音识别的装置.pdf

本发明实施例提供了一种语音识别方法、装置和用于语音识别的装置。所述方法包括：根据待处理的语音数据中各个说话人的声学特征，对所述语音数据进行切分处理，得到若干子句，每个子句包含一个说话人的语音片段；按照预设标签对所述子句进行归并处理，得到目标子句；对所述目标子句进行语音识别处理，得到所述语音数据的语音识别结果。本发明实施例可以保证每个子句的能量、说话人音调、音色的相对统一，有利于提升语音识别的准确度；并且，本发明实施例进一步还可以按照预设标签对子句进行归并处理，将存在关联关系的子句合并为目标子句，再对目标子

2023-07-25

534KB