一种语音识别方法及语音识别装置.pdf
星星****眨眼
在线预览结束,喜欢就下载吧,查找使用更方便
相关资料
一种语音识别方法及语音识别装置.pdf
本发明公开了一种语音识别方法及识别装置,具体包括以下步骤:S1:进行数据预处理,使用者首先根据其需求创建语音文件,所述语音文件包括语音数据预处理和文本数据预处理,其中所述语音数据预处理用于获取语音文件中的特征数据,所述文本数据预处理用于获取语音文件中的文本内容并提取其中出现的文字创建词典;S2:构建语音识别模型,其中所述语音识别模型基于CTC算法进行语音序列的切分。本发明提供的语音识别方法及语音识别装置具有充分提取语音数据的特征信息,同时该模型结构也采用了判断环境状态的技术,能够进一步简化语音识别的流程,
一种语音识别方法和语音识别装置.pdf
本申请实施例提供一种语音识别方法和语音识别装置,该方法包括:对语音数据流进行加窗处理,确定位于窗口内的语音数据;对窗口内的语音数据进行对象识别处理,并根据对象识别处理结果对窗口进行长度调整,并将位于调整后的窗口内的语音数据确定为目标语音段;基于识别模型对目标语音段进行语音识别处理,得到目标识别结果。这样,在对语音数据流进行加窗处理时,根据对象识别处理的结果灵活调整窗口长度,以得到不同大小的目标语音段,能够兼顾识别速度和识别效果,从而综合改善端对端语音识别场景的语音识别性能。
语音识别装置、语音识别程序和语音识别方法.pdf
本发明的目的在于,提供一种便利性更高的语音识别装置的技术。本发明的语音识别装置的特征在于,具备:存储部,其存储使画面与该画面中的选项对应的画面定义信息和确定每个选项曾被选择的次数的选择履历信息;接触指示接受部,其通过接触的操作接受指示;语音指示接受部,其通过语音的操作接受指示;和选项朗读部,当在规定画面中限制接触指示接受部接受指示时,该选项朗读部将规定画面中的选项以与曾被选择的次数相应的顺序语音输出,语音指示接受部对通过选项朗读部输出的选项中的任一项接受指示。
一种语音识别模型构建及语音识别方法、装置.pdf
本发明提供了一种语音识别模型构建及语音识别方法、装置,其中,语音识别模型构建方法包括:获取音频数据集;确定音频数据集中每一个音频数据的长度;当任一音频数据的长度大于预设长度则从音频数据中选取预设长度的音频数据作为训练样本,当任一音频数据的长度小于预设长度则将音频数据作为训练样本;对训练样本中的每一音频数据进行特征提取,得到每一个音频数据的目标语音特征并构建得到目标语音特征数据集;利用目标语音特征数据集对目标识别模型进行训练直至训练结果满足预设条件。本发明可解决现有技术中基于整条音频进行训练时速度慢及受静音
一种语音识别方法、装置和用于语音识别的装置.pdf
本发明实施例提供了一种语音识别方法、装置和用于语音识别的装置。所述方法包括:根据待处理的语音数据中各个说话人的声学特征,对所述语音数据进行切分处理,得到若干子句,每个子句包含一个说话人的语音片段;按照预设标签对所述子句进行归并处理,得到目标子句;对所述目标子句进行语音识别处理,得到所述语音数据的语音识别结果。本发明实施例可以保证每个子句的能量、说话人音调、音色的相对统一,有利于提升语音识别的准确度;并且,本发明实施例进一步还可以按照预设标签对子句进行归并处理,将存在关联关系的子句合并为目标子句,再对目标子