一种音色转换方法、装置、电子设备及可读存储介质.pdf
是你****优呀
亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种音色转换方法、装置、电子设备及可读存储介质.pdf
本发明提供了一种音色转换方法、装置、电子设备及可读存储介质,涉及音频处理技术领域。其中,所述方法包括:提取待转换语音的输入谱参数;基于所述输入谱参数,确定第一语音文本参数;基于所述音色转换模型,对所述输入谱参数进行变分自编码处理及注意力机制处理,确定所述语音声音参数;基于所述音色转换模型,对所述语音声音参数及所述第一语音文本参数进行处理,确定输出谱参数;基于所述输出谱参数,得到音色转换后的目标语音。通过在变分自编码处理获得语音声音参数的过程中,加入注意力机制处理,可以提升VAE模型克服音频波动的鲁棒性,从
音色转换方法、装置、电子设备及存储介质.pdf
本申请提供一种音色转换方法、装置、电子设备及存储介质,所述方法包括:获取第一音频数据,并提取所述第一音频数据的语音频域特征;根据所述语音频域特征得到所述第一音频数据的语义特征向量;将所述语义特征向量以及预先确定的第二音色数据输入到预先构建的音色转换模型中,得到具有目标音色的语音特征向量;根据所述语音特征向量,生成第二语音数据;其中,所述第二语音数据与所述第一语音数据的音色不同。
音色转换处理方法、装置、电子设备及存储介质.pdf
本公开关于一种音色转换处理方法、装置、电子设备及存储介质。其中,所述方法包括:获取原始音频,并提取所述原始音频的音色转换信息;根据音色转换信息,合成具有目标音色的参考音频,参考音频至少包含谐波音频,所述谐波音频为与所述原始音频的音频内容一致,且仅包含谐波的音频;获取所述原始音频的正弦成分,并基于预设的插值系数,通过频谱特征插值方法对所述谐波音频与所述正弦成分做插值处理,得到音色转换后的目标音频,所述目标音频的音色介于所述原始音频的音色与所述目标音色之间。这样,合成具有目标音色的参考音频后,结合基于听觉感知
语音转换方法、装置、电子设备及可读存储介质.pdf
本发明提供一种语音转换方法、装置、电子设备及可读存储介质。所述方法包括基于预设切分规则将待转换语音切分为多个待转换帧单元;提取每个所述待转换帧单元的梅尔倒谱特征;根据音素字典及每个待转换帧单元的梅尔倒谱特征,计算得到多个候选帧单元;根据待转换说话人的帧单元与目标音色说话人的帧单元之间的对应关系,匹配得到目标帧单元;计算转换代价,得到最佳路径;对最佳路径上的目标帧单元进行处理,得到目标语音。该方法在音素字典中计算得到多个候选帧单元,相对于现有技术从整个技术特征字典中查找能节省计算资源提高计算速度,同时将传统
语音转换方法、装置、电子设备及可读存储介质.pdf
本发明提供一种语音转换方法、装置、电子设备及可读存储介质。方法包括基于预设切分规则将输入语音切分为多个帧单元;提取每个帧单元的梅尔倒谱特征和基频特征;将帧单元归类到相应的音素集合;根据帧单元的梅尔倒谱特征和平行训练得到的高斯混合模型参数,计算得到输出梅尔倒谱特征;根据输入语音帧单元基频,原始音素集合的基频特征和目标语音素集合的基频特征,计算得到输出基频;根据输出梅尔倒谱特征及输出基频计算得到输入语音转换后对应的输出语音。该方法不仅改善因忽略语音瞬时信息而导致的语音连续性差的缺点,还弥补整体训练的高斯混合模