一种端到端语音合成方法和装置.pdf
雨巷****凝海
亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种端到端语音合成方法和装置.pdf
本发明涉及一种端到端语音合成方法,所述方法具体包括:构建包括HAE、HCE、HAD的层级条件变分自编码器模型;以最大化证据下界为训练目标,训练所述模型;合成语音波形。还涉及了装置,包括HAE、HCE、HAD、训练模块;其中,HAE包括:帧级、音素级、子词级、词级、句子级五级语音编码器,第一仿射模块;HCE包括:语言学表征提取模块、子词级、词级、句子级三级文本编码器;HAD包括:句子级、词级、子词级、音素级、帧级五级解码器,第二仿射模块。本发明的方法和装置,提升了合成语音的整体质量、自然性,以及韵律表现力。
一种基于WaveRNN的端到端语音合成方法.pdf
本发明公开了一种基于WaveRNN的端到端语音合成方法,包括如下具体步骤:S1、前端处理,标注语言形成神经网络深度学习的音频特征向量,音频特征向量与文本字符对应;S2、文本字符输入;本发明提供一种基于WaveRNN的端到端语音合成方法,采用WaveRNN架构作为语音生成器,重构损失的相位信息,梅尔频谱特征逆变换为时域波形样本,进而生成语音提升合成语音的质量,合成的语音保真度较高,本发明中WaveRNN由称为双softmax层组成组成;WaveRNN其具有与最先进的WaveNet模型的质量匹配的双softm
端到端语音识别模型处理方法、语音识别方法及相关装置.pdf
本发明提供的端到端语音识别模型处理方法、语音识别方法及相关装置,方法包括:获取预设词表和文本语料集;其中,所述预设词表用于维护任意一种直播领域中的热词、所述热词对应的发音路径和建模单元;根据所述文本语料集,训练初始的语言模型的模型参数,得到所述直播领域对应的目标语言模型;根据所述热词的发音路径和建模单元,更新所述目标语言模型,并确定更新后的目标语言模型中所述热词的权重;根据更新后的所述目标语言模型,生成端到端语音识别模型。由于在生成的目标语音识别模型中包含了直播领域中的热词的权重,因而使得模型能够实在语音
端到端语音到语音翻译的优化方法综述.docx
端到端语音到语音翻译的优化方法综述目录一、内容综述................................................21.研究背景与意义........................................32.国内外研究现状........................................43.论文研究目的及内容....................................5二、端到端语音翻译系统概述....................
基于多信息融合的端到端语音合成方法研究.docx
基于多信息融合的端到端语音合成方法研究基于多信息融合的端到端语音合成方法研究摘要:语音合成是将文本转化为自然流畅的语音信号的过程。传统的语音合成算法采用基于拼接单元的方法,需要大量的语音数据和人工标注。而端到端的语音合成方法直接从文本到语音信号的映射,能够避免繁琐的特征提取和拼接操作,有效减少合成过程的复杂度。然而,当前的端到端语音合成方法在音质和语音自然度上仍存在一定的问题。本文提出一种基于多信息融合的端到端语音合成方法,通过融合文本信息、音素信息和音频特征信息,改进语音合成系统的性能。实验证明,该方法