基于端到端模型的混合语音识别系统及方法.pdf
东耀****哥哥
亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
基于端到端模型的混合语音识别系统及方法.pdf
本发明涉及一种基于端到端模型的混合语音识别系统及方法,包括特征提取模块、语言模型、基于端到端模型的声学模型、解码器、词图重估模块以及输出模块。本发明采用声学语言端到端建模技术,对海量语音数据进行建模,并将端到端模型的编码网络作为声学模型,嵌入到混合语音识别系统中,不仅进一步提高了语音识别准确率,而且解决了纯端到端语音识别系统在项目中难以做定制化的问题。另外,本发明在端到端模型的编码网络的基础上,继续做鉴别性声学模型训练(SMBR、MPE等),可以进一步提高识别准确率。
端到端语音识别系统.pptx
语音识别系统概述语音识别系统概述语音识别系统概述语音识别系统概述端到端识别原理简介端到端识别原理简介端到端识别原理简介端到端识别原理简介特征提取与预处理特征提取与预处理特征提取与预处理特征提取与预处理模型结构与训练模型结构与训练模型结构与训练模型结构与训练解码与后处理技术解码与后处理技术解码与后处理技术解码与后处理技术数据集与实验设置数据集与实验设置数据集与实验设置数据集与实验设置实验结果与分析实验结果与分析实验结果与分析实验结果与分析总结与未来工作展望总结与未来工作展望总结与未来工作展望总结与未来工作展
基于端对端transformer模型的语音识别方法.pdf
本发明公开了基于端对端transformer模型的语音识别方法,该方法包括:对原始语音信息进行预处理,得到音频序列信息;结合噪声修剪技术,构建transformer语音识别网络模型;基于transformer语音识别网络模型对音频序列信息进行识别处理,得到语音识别结果。通过使用本发明,能够通过获取语音数据的全局~局部信息和高层~低层特征信息进而提高模型的语音识别准确度。本发明作为基于端对端transformer模型的语音识别方法,可广泛应用于深度学习语音识别技术领域。
端到端语音识别模型处理方法、语音识别方法及相关装置.pdf
本发明提供的端到端语音识别模型处理方法、语音识别方法及相关装置,方法包括:获取预设词表和文本语料集;其中,所述预设词表用于维护任意一种直播领域中的热词、所述热词对应的发音路径和建模单元;根据所述文本语料集,训练初始的语言模型的模型参数,得到所述直播领域对应的目标语言模型;根据所述热词的发音路径和建模单元,更新所述目标语言模型,并确定更新后的目标语言模型中所述热词的权重;根据更新后的所述目标语言模型,生成端到端语音识别模型。由于在生成的目标语音识别模型中包含了直播领域中的热词的权重,因而使得模型能够实在语音
一种基于WaveRNN的端到端语音合成方法.pdf
本发明公开了一种基于WaveRNN的端到端语音合成方法,包括如下具体步骤:S1、前端处理,标注语言形成神经网络深度学习的音频特征向量,音频特征向量与文本字符对应;S2、文本字符输入;本发明提供一种基于WaveRNN的端到端语音合成方法,采用WaveRNN架构作为语音生成器,重构损失的相位信息,梅尔频谱特征逆变换为时域波形样本,进而生成语音提升合成语音的质量,合成的语音保真度较高,本发明中WaveRNN由称为双softmax层组成组成;WaveRNN其具有与最先进的WaveNet模型的质量匹配的双softm