语音转换方法、装置、电子设备及可读存储介质.pdf
一条****轩吗
亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音转换方法、装置、电子设备及可读存储介质.pdf
本发明提供一种语音转换方法、装置、电子设备及可读存储介质。所述方法包括基于预设切分规则将待转换语音切分为多个待转换帧单元;提取每个所述待转换帧单元的梅尔倒谱特征;根据音素字典及每个待转换帧单元的梅尔倒谱特征,计算得到多个候选帧单元;根据待转换说话人的帧单元与目标音色说话人的帧单元之间的对应关系,匹配得到目标帧单元;计算转换代价,得到最佳路径;对最佳路径上的目标帧单元进行处理,得到目标语音。该方法在音素字典中计算得到多个候选帧单元,相对于现有技术从整个技术特征字典中查找能节省计算资源提高计算速度,同时将传统
语音转换方法、装置、电子设备及可读存储介质.pdf
本发明提供一种语音转换方法、装置、电子设备及可读存储介质。方法包括基于预设切分规则将输入语音切分为多个帧单元;提取每个帧单元的梅尔倒谱特征和基频特征;将帧单元归类到相应的音素集合;根据帧单元的梅尔倒谱特征和平行训练得到的高斯混合模型参数,计算得到输出梅尔倒谱特征;根据输入语音帧单元基频,原始音素集合的基频特征和目标语音素集合的基频特征,计算得到输出基频;根据输出梅尔倒谱特征及输出基频计算得到输入语音转换后对应的输出语音。该方法不仅改善因忽略语音瞬时信息而导致的语音连续性差的缺点,还弥补整体训练的高斯混合模
语音转换方法、装置、电子设备和存储介质.pdf
本发明提供一种语音转换方法、装置、电子设备和存储介质,其中方法包括:确定源发音人语音的发音人无关特征;基于样本语音的发音人无关特征和声学特征,对所述源发音人语音的发音人无关特征进行声学转换,得到目标声学特征,所述样本语音中的部分为类人声音频;基于所述目标声学特征进行语音合成,得到目标发音人的目标语音。本发明提供的方法、装置、电子设备和存储介质,通过在样本语音中添加类人声音频,使得样本语音能够覆盖人声各声部的音域,由此能够学习到更广音域下语音的发音人无关特征和声学特征,因此能够克服跨音域转换时的音域匹配问题
文本语音转化方法、装置、电子设备及可读存储介质.pdf
本申请提供了一种文本语音转化方法、装置、电子设备及可读存储介质,其中,该方法包括:根据配置信息,为待处理文本配置目标语音属性,所述配置信息包括所述目标语音属性;获取语音数据库中所述待处理文本对应的音频文件;根据所述目标语音属性,播放所述音频文件。本申请通过为待处理文本配置相应的目标语音属性,使得通过语音属性实现对待处理文本的播放进行控制,以实现音频输出的声音富有人类情感,能够逼真的模拟人类的声音。
语音生成方法、装置、电子设备及可读存储介质.pdf
本申请实施例提供了一种语音生成方法、装置、电子设备及可读存储介质,同时,由电子设备执行的上述语音生成方法可以使用人工智能模型来执行。而该语音生成方法包括:获取待处理信息;对待处理信息进行编码,得到信息编码结果;基于信息编码结果,生成目标用户对应于目标语言的语音信息。在本申请实施例中,由于在生成语音信息时,是基于目标用户的语音特征、信息编码结果以及目标语言特征来生成的,即在生成语音信息时,考虑到了目标用户的声音特色以及目标语言的语言特征,此时可以保证合成的语音信息与目标用户在说目标语言时的音色更加贴合,提升