语音生成方法、装置、电子设备及可读存储介质.pdf
书生****瑞梦
亲,该文档总共37页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音生成方法、装置、电子设备及可读存储介质.pdf
本申请实施例提供了一种语音生成方法、装置、电子设备及可读存储介质,同时,由电子设备执行的上述语音生成方法可以使用人工智能模型来执行。而该语音生成方法包括:获取待处理信息;对待处理信息进行编码,得到信息编码结果;基于信息编码结果,生成目标用户对应于目标语言的语音信息。在本申请实施例中,由于在生成语音信息时,是基于目标用户的语音特征、信息编码结果以及目标语言特征来生成的,即在生成语音信息时,考虑到了目标用户的声音特色以及目标语言的语言特征,此时可以保证合成的语音信息与目标用户在说目标语言时的音色更加贴合,提升
语音转换方法、装置、电子设备及可读存储介质.pdf
本发明提供一种语音转换方法、装置、电子设备及可读存储介质。方法包括基于预设切分规则将输入语音切分为多个帧单元;提取每个帧单元的梅尔倒谱特征和基频特征;将帧单元归类到相应的音素集合;根据帧单元的梅尔倒谱特征和平行训练得到的高斯混合模型参数,计算得到输出梅尔倒谱特征;根据输入语音帧单元基频,原始音素集合的基频特征和目标语音素集合的基频特征,计算得到输出基频;根据输出梅尔倒谱特征及输出基频计算得到输入语音转换后对应的输出语音。该方法不仅改善因忽略语音瞬时信息而导致的语音连续性差的缺点,还弥补整体训练的高斯混合模
语音转换方法、装置、电子设备及可读存储介质.pdf
本发明提供一种语音转换方法、装置、电子设备及可读存储介质。所述方法包括基于预设切分规则将待转换语音切分为多个待转换帧单元;提取每个所述待转换帧单元的梅尔倒谱特征;根据音素字典及每个待转换帧单元的梅尔倒谱特征,计算得到多个候选帧单元;根据待转换说话人的帧单元与目标音色说话人的帧单元之间的对应关系,匹配得到目标帧单元;计算转换代价,得到最佳路径;对最佳路径上的目标帧单元进行处理,得到目标语音。该方法在音素字典中计算得到多个候选帧单元,相对于现有技术从整个技术特征字典中查找能节省计算资源提高计算速度,同时将传统
生成视频的方法、装置、电子设备及可读存储介质.pdf
本公开关于一种生成视频的方法、装置、电子设备及可读存储介质,属于多媒体技术领域。方法包括:获取视频模板的配置文件,配置文件用于描述视频模板的一个或多个参考素材,以及每个参考素材对应的动画特效。解析配置文件,根据解析后的配置文件获取一个或多个参考素材。获取目标素材,根据目标素材替换一个或多个参考素材,得到一个或多个替换后的参考素材。根据解析后的配置文件渲染一个或多个替换后的参考素材,生成具有动画特效的目标视频。本公开可基于用户上传的目标素材生成具有动画特效的目标视频,因而用户无需手动添加动画特效,从而简化了
语音生成方法及装置、存储介质、电子设备.pdf
本公开属于语音处理技术领域,涉及一种语音生成方法及装置、存储介质、电子设备。该方法包括:获取待处理语音的语音特征向量,并将语音特征向量输入至语音生成模型得到语言单元向量;获取文本特征向量,并根据文本特征向量和语言单元向量确定待处理特征向量;将待处理特征向量输入至序列到序列模型中得到声学特征向量,并将声学特征向量输入至声码器得到与待处理语音或文本特征向量对应的目标语音。本公开接收语音和文本作为输入,将语音合成任务和语音音色转换任务融合起来,提升了语音合成任务和语音音色转换任务的性能,提供了多种音色克隆的策略