一种语音识别方法和语音识别装置.pdf
志信****pp
亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种语音识别方法和语音识别装置.pdf
本申请实施例提供一种语音识别方法和语音识别装置,该方法包括:对语音数据流进行加窗处理,确定位于窗口内的语音数据;对窗口内的语音数据进行对象识别处理,并根据对象识别处理结果对窗口进行长度调整,并将位于调整后的窗口内的语音数据确定为目标语音段;基于识别模型对目标语音段进行语音识别处理,得到目标识别结果。这样,在对语音数据流进行加窗处理时,根据对象识别处理的结果灵活调整窗口长度,以得到不同大小的目标语音段,能够兼顾识别速度和识别效果,从而综合改善端对端语音识别场景的语音识别性能。
语音识别装置、语音识别程序和语音识别方法.pdf
本发明的目的在于,提供一种便利性更高的语音识别装置的技术。本发明的语音识别装置的特征在于,具备:存储部,其存储使画面与该画面中的选项对应的画面定义信息和确定每个选项曾被选择的次数的选择履历信息;接触指示接受部,其通过接触的操作接受指示;语音指示接受部,其通过语音的操作接受指示;和选项朗读部,当在规定画面中限制接触指示接受部接受指示时,该选项朗读部将规定画面中的选项以与曾被选择的次数相应的顺序语音输出,语音指示接受部对通过选项朗读部输出的选项中的任一项接受指示。
一种语音识别方法、装置和用于语音识别的装置.pdf
本发明实施例提供了一种语音识别方法、装置和用于语音识别的装置。所述方法包括:根据待处理的语音数据中各个说话人的声学特征,对所述语音数据进行切分处理,得到若干子句,每个子句包含一个说话人的语音片段;按照预设标签对所述子句进行归并处理,得到目标子句;对所述目标子句进行语音识别处理,得到所述语音数据的语音识别结果。本发明实施例可以保证每个子句的能量、说话人音调、音色的相对统一,有利于提升语音识别的准确度;并且,本发明实施例进一步还可以按照预设标签对子句进行归并处理,将存在关联关系的子句合并为目标子句,再对目标子
一种语音识别方法及语音识别装置.pdf
本发明公开了一种语音识别方法及识别装置,具体包括以下步骤:S1:进行数据预处理,使用者首先根据其需求创建语音文件,所述语音文件包括语音数据预处理和文本数据预处理,其中所述语音数据预处理用于获取语音文件中的特征数据,所述文本数据预处理用于获取语音文件中的文本内容并提取其中出现的文字创建词典;S2:构建语音识别模型,其中所述语音识别模型基于CTC算法进行语音序列的切分。本发明提供的语音识别方法及语音识别装置具有充分提取语音数据的特征信息,同时该模型结构也采用了判断环境状态的技术,能够进一步简化语音识别的流程,
语音识别方法和装置.pdf
为提供更全面地提取特征和对音频刻画更为具体因而识别能力更强的语音识别技术,发明人提出了一种语音识别方法,包括下步骤:以预设采样参数以及预设格式存储儿童语音信息;从存储的儿童语音信息中提取每帧音频的39维梅尔频率倒谱系数,并用混合高斯模型描述所述各帧音频的39维梅尔频率倒谱系数;训练各状态的混合高斯模型并构建各状态的隐马尔科夫模型;以gmm-hmm模型为基础初始化一深度信念网络;以经训练的混合高斯模型-隐马尔科夫模型对所述深度信念网络进行调整,得到基于深度信念网络的dnn-hmm模型;利用所述基于深度信念网