语音转换方法、装置、电子设备和存储介质.pdf
玉军****la
亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音转换方法、装置、电子设备和存储介质.pdf
本发明提供一种语音转换方法、装置、电子设备和存储介质,其中方法包括:确定源发音人语音的发音人无关特征;基于样本语音的发音人无关特征和声学特征,对所述源发音人语音的发音人无关特征进行声学转换,得到目标声学特征,所述样本语音中的部分为类人声音频;基于所述目标声学特征进行语音合成,得到目标发音人的目标语音。本发明提供的方法、装置、电子设备和存储介质,通过在样本语音中添加类人声音频,使得样本语音能够覆盖人声各声部的音域,由此能够学习到更广音域下语音的发音人无关特征和声学特征,因此能够克服跨音域转换时的音域匹配问题
语音转换方法、装置、电子设备及可读存储介质.pdf
本发明提供一种语音转换方法、装置、电子设备及可读存储介质。所述方法包括基于预设切分规则将待转换语音切分为多个待转换帧单元;提取每个所述待转换帧单元的梅尔倒谱特征;根据音素字典及每个待转换帧单元的梅尔倒谱特征,计算得到多个候选帧单元;根据待转换说话人的帧单元与目标音色说话人的帧单元之间的对应关系,匹配得到目标帧单元;计算转换代价,得到最佳路径;对最佳路径上的目标帧单元进行处理,得到目标语音。该方法在音素字典中计算得到多个候选帧单元,相对于现有技术从整个技术特征字典中查找能节省计算资源提高计算速度,同时将传统
语音转换方法、装置、电子设备及可读存储介质.pdf
本发明提供一种语音转换方法、装置、电子设备及可读存储介质。方法包括基于预设切分规则将输入语音切分为多个帧单元;提取每个帧单元的梅尔倒谱特征和基频特征;将帧单元归类到相应的音素集合;根据帧单元的梅尔倒谱特征和平行训练得到的高斯混合模型参数,计算得到输出梅尔倒谱特征;根据输入语音帧单元基频,原始音素集合的基频特征和目标语音素集合的基频特征,计算得到输出基频;根据输出梅尔倒谱特征及输出基频计算得到输入语音转换后对应的输出语音。该方法不仅改善因忽略语音瞬时信息而导致的语音连续性差的缺点,还弥补整体训练的高斯混合模
一种语音转换方法、装置、电子设备及存储介质.pdf
本公开提供了一种语音转换方法、装置、电子设备及存储介质,所述方法包括:根据完成数据增强处理的非目标发音人音频数据集和目标发音人音频数据对初始语音转换模型进行训练,得到目标语音转换模型;获取源发音人音频数据;将所述源发音人音频数据输入所述目标语音转换模型,获得目标音频数据,应用本方法可以使进行语音转换模型训练的音频数据具有多样性,通过完成数据增强处理的语音数据对语音转换模型进行训练,可以获得鲁棒性更好的目标语音转换模型,减少现实应用中语音转换性能的下降,在真实使用场景中使用目标语音转换模型进行语音转换时可以
语音转换方法、装置、设备、存储介质和程序产品.pdf
本申请涉及一种语音转换方法、装置、设备、存储介质和程序产品。所述方法包括:获取待转换语音数据对应的原始语义特征;通过对齐信息将所述原始语义特征对应的语音长度进行调整,获得目标语义特征;所述对齐信息为根据多个原始语义特征和对应的标准语义特征之间的映射关系生成;通过所述目标语义特征确定所述待转换语音数据转换后的目标语音数据。采用本方法能够加快语音转换速度。