语音处理方法及装置、存储介质、电子设备.pdf
小云****66
亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
语音处理方法及装置、存储介质、电子设备.pdf
本公开属于语音克隆技术领域,涉及一种语音处理方法及装置、存储介质、电子设备。该方法包括:对目标视频进行分离得到音频轨道和视频轨道,并采集被模仿者的第一语音;提取第一语音的第一语音特征,并将第一语音特征和音频轨道中的第二语音输入音色转换模型,以将音频轨道中第二语音的音色从第二音色转换至第一音色;其中,第一音色与第一语音对应,第二音色与第二语音对应;将音色转换后的音频轨道与视频轨道合并,以得到具有被模仿者音色的目标视频。在本公开中,通过识别第二语音的音素,实现了任意第二语音的音色的转换。
语音处理方法、装置、存储介质及电子设备.pdf
本说明书公开了一种语音处理方法、装置、存储介质及电子设备,其中,方法包括:通过对目标语音数据进行语义识别处理以确定目标语音数据对应的至少一个目标语义标签,然后可以基于目标语音数据对应的各目标语义标签对参考语音集合进行语音匹配处理,可以得到目标语音数据对应的相似语音数据。
语音处理方法、装置、电子设备及存储介质.pdf
本公开关于一种语音处理方法、装置、电子设备及存储介质,该方法包括:获取待处理语音的初始分词和音乐伴奏的伴奏节奏时间戳;所述初始分词为所述待处理语音的语音识别词;根据所述伴奏节奏时间戳,对所述初始分词进行更新,得到所述待处理语音的目标分词;将所述目标分词的分词时间戳和伴奏节奏时间戳进行时间对齐处理,得到所述目标分词的分词时间戳和所述伴奏节奏时间戳之间的目标对应关系;根据所述待处理语音、所述音乐伴奏和所述目标对应关系,生成所述待处理语音对应的音乐。采用本方法,有利于提高生成的音乐的音乐效果。
语音处理方法、装置、电子设备及存储介质.pdf
本公开涉及一种语音处理方法、装置、电子设备及存储介质,其中,该方法通过获取待处理语音对应的频谱特征,将待处理语音对应的频谱特征输入至语音增强模型,语音增强模型的编码器对待处理语音对应的频谱特征进行编码,获得语音编码特征,由第一编码器对语音编码特征进行处理,得到共享频谱特征,第二编码器和第三编码器分别根据共享频谱特征,获得用于降噪的第一掩码和用于混响抑制的第二掩码;通过第一掩码、第二掩码及待处理语音对应的频谱特征进行掩码计算,获得目标频谱特征,进而根据目标频谱合成获得进行了降噪以及混响抑制的目标语音。本方案
语音处理方法、装置、电子设备以及存储介质.pdf
本公开提供了语音处理方法、装置、电子设备、存储介质以及程序产品,涉及人工智能技术领域,尤其涉及车联网和智能座舱等技术领域。具体实现方案为:响应于语音交互功能被唤醒,获取被用于唤醒语音交互功能的唤醒语音的唤醒声纹特征;从接收到的交互语音中提取至少一个交互声纹特征,交互语音中包括至少一个单声源交互语音,至少一个单声源交互语音与至少一个交互声纹特征一一对应;从至少一个交互声纹特征中确定与唤醒声纹特征相匹配的目标交互声纹特征;从与目标交互声纹特征相对应的目标单声源交互语音中提取目标语音特征;以及发送目标语音特征,