一种语音转换方法、装置、设备及介质.pdf
是你****松呀
亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种语音转换方法、装置、设备及介质.pdf
本申请涉及人工智能技术,提供一种语音转换方法、装置、设备及介质。其中的方法包括:获取来自源说话人的源语音信息;通过训练后的语音转换模型对源语音信息进行内容特征提取,得到源语音信息的内容特征;对源语音信息进行说话人特征提取,得到源说话人的说话人特征;对内容特征、源说话人的说话人特征和目标基频信息进行处理,得到转换后的目标语音信息;输出目标语音信息,可提高语音转换后的目标语音的自然度和韵律连贯特性。
一种语音转换方法、装置、设备和存储介质.pdf
本发明提供了一种语音转换方法、装置、设备和存储介质,在线客服打开后,展示信息录入界面并向在线客服发送信息录入界面的录音接收请求,其中信息录入界面基于H5页面构建而成。基于语音录入区域的语音录入请求,获取在线客服在终端设备的录音权限。然后获取录入权限的授权结果,在收到录音授权后向在线客服发送录音通知进行录音。再将录制完成的录音文件发送至服务端进行文字转换。将得到的文字转换结果通过接收接口展示文字转换结果。采用H5页面构建信息录入界面,调用终端设备的原生录音功能进录音后到服务端进行文字的转换,实现了在终端内内
语音转换方法、训练方法、装置、设备及介质.pdf
本申请实施例提供的语音转换方法、训练方法、装置、设备及介质,根据源说话人的源语音数据获取所述源说话人的源线性谱;将所述源线性谱输入至预先训练好的语音编码模型中,输出对应的频谱特征预测数据;将所述频谱特征预测数据以及目标说话人的目标说话人特征数据输入至语音重建模型中,输出对应的目标语音数据;通过上述方式,将源语音数据的内容信息与说话人特征进行解耦,在语音编码模型的训练阶段以及语音转换阶段,语音编码模型的输入和输出分别仅包含内容信息,通过语音重建模型对内容信息和说话人特征一起重建语音数据,有利于提高语音编码模
一种语音转换方法、装置、电子设备及存储介质.pdf
本公开提供了一种语音转换方法、装置、电子设备及存储介质,所述方法包括:根据完成数据增强处理的非目标发音人音频数据集和目标发音人音频数据对初始语音转换模型进行训练,得到目标语音转换模型;获取源发音人音频数据;将所述源发音人音频数据输入所述目标语音转换模型,获得目标音频数据,应用本方法可以使进行语音转换模型训练的音频数据具有多样性,通过完成数据增强处理的语音数据对语音转换模型进行训练,可以获得鲁棒性更好的目标语音转换模型,减少现实应用中语音转换性能的下降,在真实使用场景中使用目标语音转换模型进行语音转换时可以
一种实时语音转换方法、装置、电子设备及介质.pdf
本申请提供了一种实时语音转换方法、装置、电子设备及介质,方法包括以下步骤:从实时录制的源说话对象的语音数据中,截取出满足语音分段条件的第一语音数据;处理所述第一语音数据提取出第一语义信息;将第一语义信息输入到预先训练好的语音转换模型中,并通过所述语音转换模型对第一语义信息和第一语音数据之前历史语音数据的有效信息进行转换处理,得到对应第一语义信息和目标说话对象语音因素的目标语音特征信息;将目标语音特征信息进行重构,得到所述第一语音数据转换后的第二语音数据,从而实现低延迟的流式推理,实现低延迟、高性能的实时语