语音处理方法及装置、存储介质、电子设备.pdf
小云****66
亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音处理方法、装置、电子设备及存储介质.pdf
本公开涉及一种语音处理方法、装置、电子设备及存储介质,其中,该方法通过获取待处理语音对应的频谱特征,将待处理语音对应的频谱特征输入至语音增强模型,语音增强模型的编码器对待处理语音对应的频谱特征进行编码,获得语音编码特征,由第一编码器对语音编码特征进行处理,得到共享频谱特征,第二编码器和第三编码器分别根据共享频谱特征,获得用于降噪的第一掩码和用于混响抑制的第二掩码;通过第一掩码、第二掩码及待处理语音对应的频谱特征进行掩码计算,获得目标频谱特征,进而根据目标频谱合成获得进行了降噪以及混响抑制的目标语音。本方案
语音处理方法、装置、电子设备及存储介质.pdf
本公开关于一种语音处理方法、装置、电子设备及存储介质,该方法包括:获取待处理语音的初始分词和音乐伴奏的伴奏节奏时间戳;所述初始分词为所述待处理语音的语音识别词;根据所述伴奏节奏时间戳,对所述初始分词进行更新,得到所述待处理语音的目标分词;将所述目标分词的分词时间戳和伴奏节奏时间戳进行时间对齐处理,得到所述目标分词的分词时间戳和所述伴奏节奏时间戳之间的目标对应关系;根据所述待处理语音、所述音乐伴奏和所述目标对应关系,生成所述待处理语音对应的音乐。采用本方法,有利于提高生成的音乐的音乐效果。
语音处理方法及装置、存储介质、电子设备.pdf
本公开属于语音克隆技术领域,涉及一种语音处理方法及装置、存储介质、电子设备。该方法包括:对目标视频进行分离得到音频轨道和视频轨道,并采集被模仿者的第一语音;提取第一语音的第一语音特征,并将第一语音特征和音频轨道中的第二语音输入音色转换模型,以将音频轨道中第二语音的音色从第二音色转换至第一音色;其中,第一音色与第一语音对应,第二音色与第二语音对应;将音色转换后的音频轨道与视频轨道合并,以得到具有被模仿者音色的目标视频。在本公开中,通过识别第二语音的音素,实现了任意第二语音的音色的转换。
语音处理方法、装置、存储介质及电子设备.pdf
本说明书公开了一种语音处理方法、装置、存储介质及电子设备,其中,方法包括:通过对目标语音数据进行语义识别处理以确定目标语音数据对应的至少一个目标语义标签,然后可以基于目标语音数据对应的各目标语义标签对参考语音集合进行语音匹配处理,可以得到目标语音数据对应的相似语音数据。
语音处理方法、装置、电子设备和存储介质.pdf
本公开提供了一种语音处理方法、装置、电子设备和存储介质,涉及计算机技术领域,具体涉及语音技术和深度学习等人工智能技术领域。具体实现方案为:获取原始语音;从原始语音中提取频谱图;获取语音合成模型,其中,语音合成模型包括第一生成子模型和第二生成子模型;调用第一生成子模型对频谱图进行处理,以生成频谱图的谐波结构;以及调用第二生成子模型对谐波结构和频谱图进行处理,以生成目标语音。由此,该方法具有合成音质较好,音色还原度高,发音稳定且计算量小等特点。