一种语音增强方法、语音识别方法、聚类方法及装置.pdf
雨巷****凝海
亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种语音增强方法、语音识别方法、聚类方法及装置.pdf
本发明公开一种语音增强方法、语音识别方法、聚类方法及装置。方法包括:选取与测试语音的第一帧语音部分的特征向量最匹配的特征向量聚类中心;针对测试语音包含的其他各帧语音部分的特征向量执行:从与该语音部分的前一帧语音部分的特征向量最匹配的特征向量聚类中心,以及与前一帧语音部分的特征向量最匹配的特征向量聚类中心相邻的特征向量聚类中心中,选取与该语音部分的特征向量最匹配的特征向量聚类中心;根据测试语音包含的各帧语音部分的特征向量、选取的特征向量聚类中心重建测试语音的特征向量。本发明由于在进行语音增强利用了能够表示语
基于音频增强的语音识别方法及装置.pdf
本发明公开了一种基于音频增强的语音识别方法及装置,包括将麦克风阵列拾取的多通道声源声音数据经过第一滤波函数计算获得第一数据,将第一数据经过第二滤波函数计算获得第二数据,将第二数据通过波束形成算法处理得到单通道音频信号;将单通道音频信号经过基于第一环境噪声降噪算法进行处理获得第三数据;将第三数据通过语音识别模型进行识别。本发明将麦克风阵列拾取的多通道语音数据先消除由于声源声音遇到不同障碍物反射和吸收造成的不同延时的多路反射混合语音数据,然后去除第二数据中的非目标声源声音数据,最后去除环境噪声,实现对声源声音
一种语音识别方法及语音识别装置.pdf
本发明公开了一种语音识别方法及识别装置,具体包括以下步骤:S1:进行数据预处理,使用者首先根据其需求创建语音文件,所述语音文件包括语音数据预处理和文本数据预处理,其中所述语音数据预处理用于获取语音文件中的特征数据,所述文本数据预处理用于获取语音文件中的文本内容并提取其中出现的文字创建词典;S2:构建语音识别模型,其中所述语音识别模型基于CTC算法进行语音序列的切分。本发明提供的语音识别方法及语音识别装置具有充分提取语音数据的特征信息,同时该模型结构也采用了判断环境状态的技术,能够进一步简化语音识别的流程,
一种车载环境下的语音增强方法和语音识别方法.pdf
本申请公开了一种车载环境下的语音增强方法和语音识别方法,将改进的谱减法结合模糊理论,使得谱减法系数能够自适应不同的语音信号,能够有效的消除噪音,避免“音乐噪音”问题,同时提高信噪比,保留了语音信号的有效信号。通过实际仿真运算和车内实验,采用本文算法后,能够有效提高行驶车内的语音识别准确率。
一种语音识别方法和语音识别装置.pdf
本申请实施例提供一种语音识别方法和语音识别装置,该方法包括:对语音数据流进行加窗处理,确定位于窗口内的语音数据;对窗口内的语音数据进行对象识别处理,并根据对象识别处理结果对窗口进行长度调整,并将位于调整后的窗口内的语音数据确定为目标语音段;基于识别模型对目标语音段进行语音识别处理,得到目标识别结果。这样,在对语音数据流进行加窗处理时,根据对象识别处理的结果灵活调整窗口长度,以得到不同大小的目标语音段,能够兼顾识别速度和识别效果,从而综合改善端对端语音识别场景的语音识别性能。