音频处理方法和装置、音频模型训练方法和装置、电子设备及计算机可读存储介质.pdf
春景****23
亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
音频处理方法和装置、音频模型训练方法和装置、电子设备及计算机可读存储介质.pdf
本申请公开了一种音频处理方法和装置、音频模型训练方法和装置、电子设备及计算机可读存储介质。该方法包括:获取待处理音频;提取所述待处理音频的特征向量;使用基于预定采样音频生成的混响训练音频训练获得的预定模型对所述特征向量进行计算以获得处理后音频。本申请实施例通过在模型训练中使用直达声和早期反射音频生成的音频作为训练的目标音频来对模型进行训练,并且在实际使用中使用经过这样训练的模型来对混合音频进行处理,因此,由于通过选用早期反射声,而不是直达声作为模型训练和恢复目标,可以有效地保护原始目标音频,保证处理后音频
音频处理方法、装置、电子设备和可读存储介质.pdf
本申请公开了一种音频处理方法、装置、电子设备和可读存储介质,属于人工智能技术领域。其中,所述方法包括:获取第一音频;获取与所述第一音频匹配的目标中心句;获取所述第一音频中与所述目标中心句对应的第一子序列;在所述目标中心句与所述第一子序列之间的第一相似度小于或者等于第一阈值的情况下,获取所述第一子序列与目标相似序列之间的第二相似度,所述目标相似序列为所述目标中心句的一个相似序列;在所述第二相似度大于第二阈值的情况下,确定所述第一音频包括所述目标中心句。
音频处理方法、装置及电子设备和计算机可读存储介质.pdf
本申请公开了一种音频处理方法、装置及一种电子设备和计算机可读存储介质,该方法包括:获取目标干声音频,确定目标干声音频中每个歌词字的起止时间;检测目标干声音频的调高和每段起止时间内的基频,并基于基频和调高确定每个歌词字的当前音名;对每个歌词字分别进行对应的第一音分跨度和多个不同的第二音分跨度的升调处理,分别得到第一和声和多个不同的第二和声;多个不同的第二音分跨度为第一音分跨度与多个不同的第三音分跨度的和,第一音分跨度与第三音分跨度相差一个数量级;将第一和声和多个不同的第二和声进行合成形成多轨和声,混合多轨和
音频处理方法、装置、电子设备和计算机可读存储介质.pdf
本公开关于一种音频处理方法、装置、电子设备和计算机可读存储介质。音频处理方法包括:获取至少一个音频数据以及每个音频数据的虚拟场景位置信息,其中,所述至少一个音频数据包括由至少一个推流端推送的至少一个音频流数据,所述每个音频数据的虚拟场景位置信息指示对应音频数据在虚拟场景中的位置;基于所述每个音频数据的虚拟场景位置信息,计算对应音频数据的渲染信息,从而得到每个音频数据的渲染信息,其中,所述每个音频数据的渲染信息用于渲染对应音频数据以形成其在所述虚拟场景中的位置的空间感;基于所述至少一个音频数据以及所述每个音
音频表的处理方法、装置、电子设备和可读存储介质.pdf
本发明提供一种音频表的处理方法、装置、电子设备和可读存储介质。音频表的处理方法包括以下步骤:获取目标音频通道的目标音频数据;通过FPGA根据所述目标音频数据生成所述目标音频通道对应的目标音频表;在与所述目标音频通道对应的目标位置绘制所述目标音频表的图像。本发明实施例能够提高音频表的生成和绘制速度,降低音频表的生成延迟。本发明的一些实施例还能够根据原始图像的亮度调节目标音频表的图像的亮度和透明度,有助于进一步提高显示效果。