语音合成方法、装置、设备及存储介质.pdf
是你****馨呀
亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
合成中文语音的方法、装置、设备及存储介质.pdf
本发明涉及人工智能领域的语言信号处理领域,公开了合成中文语音的方法、装置、设备及存储介质,用于减少训练时长,同时增强模型表现力和泛化能力,进一步提高合成的语音质量。本发明方法包括:获取初始梅尔频谱和目标向量;对目标向量进行处理得到第一序列,第一序列为二维张量;对初始梅尔频谱进行处理,得到目标梅尔频谱;确定第一序列与目标梅尔频谱在各个子空间中的目标对应关系;根据自注意力机制和目标对应关系进行语音合成,得到目标语音。
语音合成方法、装置、设备及存储介质.pdf
本发明涉及语义合成技术领域,公开了一种语音合成方法、装置、计算机设备及计算机可读存储介质,该方法包括:获取待合成文本,并通过语音合成模型将所述待合成文本转换为图嵌入向量信息,根据图编码器对所述图嵌入向量信息进行编码,生成对应的第一中间向量信息,根据所述第一中间向量信息生成对应的梅尔语谱信息,输出所述梅尔语谱信息对应的语音合成信息,实现通过图辅助编码器分析文本信息的具体语义信息来映射到不同的语音韵律节奏,使得韵律调节的过程成为一个全自动化的过程,提高了语音合成的准确率。同时,本发明还涉及区块链技术,且本发明
语音合成方法、装置、设备、存储介质及程序产品.pdf
本申请公开了一种语音合成方法、装置、设备、存储介质及程序产品,涉及人工智能领域。该方法包括:响应于文本输入操作,获取输入文本;响应于语音类型选择操作,确定目标语音类型,所述目标语音类型包括目标情感类型与目标音色类型;响应于语音合成操作,按照所述目标语音类型对所述输入文本进行语音合成,得到目标语音,所述目标语音是具有所述目标情感类型对应情感与所述目标音色类型对应音色的音频。本申请实施例提供的方法,可使合成语音具有用户指定的情感特性与音色特性,丰富语音效果,有助于提高合成语音的真实性与自然性。
语音合成方法、装置、存储介质及电子设备.pdf
本申请实施例公开了一种语音合成方法、装置、存储介质及电子设备,属于计算机技术领域。方法包括:服务器获取文本数据,并将文本数据转换成至少一个音素序列,基于预训练的语音合成模型对至少一个音素序列进行语音合成处理得到文本数据对应的梅尔频谱,基于文本数据对应的梅尔频谱得到文本数据对应的合成语音,使服务器能精准地合成较为真实的语音。
语音合成方法、装置、设备、存储介质及程序产品.pdf
本申请公开了一种语音合成方法、装置、设备、存储介质及程序产品,涉及人工智能领域。该方法包括:获取目标文本的目标音素、目标情感以及目标音色;对目标音素对应的目标音素特征与目标情感对应的目标情感特征进行特征融合,得到音素融合特征;基于音素融合特征与目标音色对应的目标音色特征进行发音预测,得到目标音素对应的语音发音特征;对语音发音特征进行特征解码,得到目标声学特征;基于目标声学特征合成目标语音,目标语音与目标文本相对应,目标语音是具有目标情感与目标音色的音频。本申请实施例提供的方法,可得到不同情感以及不同音色的