语音处理方法、装置、电子设备和介质.pdf
St****36
亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音处理方法、装置、电子设备和介质.pdf
本公开公开了一种语音处理方法、装置、设备、介质和产品,涉及语音技术领域。语音处理方法包括:从针对多个对象的第一语音数据中,确定针对多个对象中目标对象的至少一个语音片段;基于至少一个语音片段,确定目标对象的声纹特征;基于目标对象的声纹特征,处理第二语音数据,得到第二语音数据中针对目标对象的语音识别结果。
语音处理方法、装置、电子设备和介质.pdf
本公开涉及一种语音处理方法、装置、电子设备和介质,尤其涉及语音处理技术领域;其中,该方法包括:对语音数据进行识别,得到对应的目标识别文本与目标声纹特征;根据目标声纹特征确定目标用户;基于目标用户对应的纠错图谱,确定目标识别文本对应的目标信息,纠错图谱中包括:目标识别文本与目标信息的对应关系;获取目标识别文本与目标信息的相似度,若相似度超过预设阈值,则将目标识别文本修改为目标信息。本公开实施例能够对目标用户的语音数据进行修正,有利于提高纠错速度,提高用户的使用体验。
语音处理方法、装置、电子设备和存储介质.pdf
本公开提供了一种语音处理方法、装置、电子设备和存储介质,涉及计算机技术领域,具体涉及语音技术和深度学习等人工智能技术领域。具体实现方案为:获取原始语音;从原始语音中提取频谱图;获取语音合成模型,其中,语音合成模型包括第一生成子模型和第二生成子模型;调用第一生成子模型对频谱图进行处理,以生成频谱图的谐波结构;以及调用第二生成子模型对谐波结构和频谱图进行处理,以生成目标语音。由此,该方法具有合成音质较好,音色还原度高,发音稳定且计算量小等特点。
语音处理方法、装置、电子设备以及介质.pdf
本公开提供了一种语音处理方法,包括:获取目标用户的第一语音数据,其中,第一语音数据的语言类别为第一语言类别,第一语音数据包括目标用户的语音特性;确定用于处理第一语音数据的处理方式,其中,处理方式包括将第一语音数据的语言类别由第一语言类别转换为第二语言类别,处理方式还包括处理第一语音数据时保留语音特性;以及基于处理方式处理第一语音数据,得到第二语音数据,其中,第二语音数据的语言类别为第二语言类别,第二语音数据包括语音特性。本公开还提供了一种语音处理装置、一种电子设备以及一种计算机可读存储介质。
语音处理方法及装置、存储介质、电子设备.pdf
本公开属于语音克隆技术领域,涉及一种语音处理方法及装置、存储介质、电子设备。该方法包括:对目标视频进行分离得到音频轨道和视频轨道,并采集被模仿者的第一语音;提取第一语音的第一语音特征,并将第一语音特征和音频轨道中的第二语音输入音色转换模型,以将音频轨道中第二语音的音色从第二音色转换至第一音色;其中,第一音色与第一语音对应,第二音色与第二语音对应;将音色转换后的音频轨道与视频轨道合并,以得到具有被模仿者音色的目标视频。在本公开中,通过识别第二语音的音素,实现了任意第二语音的音色的转换。