语音合成模型的训练方法、合成方法、系统、设备和介质.pdf
是你****盟主
亲,该文档总共25页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音合成模型的训练方法、合成方法、系统、设备和介质.pdf
本发明公开了一种语音合成模型的训练方法、合成方法、系统、设备和介质,该训练方法包括:获取若干个历史文本信息及其历史语音信息;获取历史文本信息的历史文本向量;基于CNN网络和双向LSTM网络构建初始声学模型;基于历史文本向量及其历史语音信息的第一梅尔谱,对初始声学模型进行模型训练以得到目标声学模型;基于第二梅尔谱以及历史语音信息,对预设神经网络模型进行模型训练以得到目标声码器模型。本发明中通过基于CNN网络、双向LSTM网络以及线性层搭建声学模型,基于生成式对抗网络GAN构建声码器模型,实现在保证语音合成质
语音合成方法、系统、语音合成模型及其训练方法.pdf
本申请提供一种语音合成方法、系统、语音合成模型及其训练方法,所述方法包括获取目标文本和目标文本的第一瓶颈特征;获取参考音频库,参考音频库包括若干参考音频;获取参考音频库中每一个参考音频对应的参考文本,以及,获取每一个参考文本的第二瓶颈特征;计算第一瓶颈特征与每一个参考文本的第二瓶颈特征的相似度,将与第一瓶颈特征相似度最高的第二瓶颈特征对应的参考文本确定为文本模板;将文本模板对应的参考音频确定为音频模板;将音频模板和目标文本输入预先训练的语音合成模型中,以合成具备深度情感层次特征的语音。
语音合成方法、模型训练方法、设备及存储介质.pdf
本申请提供一种语音合成方法、模型训练方法、设备及存储介质,该语音合成方法包括:获取待合成文本,输入到训练好的目标语音合成模型,得到待合成文本对应的目标语音;其中,根据预训练集对预设的语音合成模型进行预训练得到语音合成模型;采用目标应用场景对应的目标时长预测网络替换语音合成模型的时长预测网络,得到目标语音合成模型;获取目标训练集,目标训练集包括目标说话人的语音样本;从预训练集中挑选出目标说话人的同类说话人的语音样本进行mask加噪得到加噪语音样本;根据目标训练集和加噪语音样本对目标语音合成模型进行训练,得到
语音合成模型训练和语音合成方法、装置、设备及介质.pdf
本发明公开了一种语音合成模型训练和语音合成方法、装置、设备及介质。由于样本集中的任一第一语音样本对应的文本特征,均是根据预先配置的第一语言的语音单元集合与第二语言的语音单元集合的对应关系确定的,从而实现了将第一语音样本转换为第二语言的语音样本,增加了第二语言的语音样本的数量,后续基于样本集中的第一语音样本对应的文本特征样本和第一语音样本的第一声学特征,即可对原始语音合成模型进行训练,从而获取到第二语言对应的目标语音合成模型,从而实现无需大量的采集第二语言的语音样本,即可获取到第二语言的目标语音合成模型。
语音合成模型的训练方法、装置、电子设备及存储介质.pdf
本公开提供了一种语音合成模型的训练方法、装置、电子设备及存储介质,所述方法包括:将第一语音样本对应的音乐信息,输入至时长提取模块,获取乐谱样本嵌入值;将乐谱样本嵌入值和乐谱样本嵌入值对应的音高样本嵌入值输入至线性变换模块,进行降维;将线性变换模块的输出,作为框架网络模块的输入,获取音乐信息对应的第一预测样本特征;获取第一语音样本对应的隐特征;将隐特征输入至解码器中,获取隐特征对应的预测语音样本;基于第一语音样本和所述预测语音样本,调整解码器的参数;基于第一预测样本特征和隐特征,调整所述线性变换模块和框架网