音频去混响方法、装置、设备和存储介质.pdf
戊午****jj
亲,该文档总共33页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
音频去混响方法、装置、设备和存储介质.pdf
本申请公开了一种音频去混响方法、装置、设备和存储介质,属于计算机技术领域。该方法包括:根据预设扩展帧数确定扩展音频段;将扩展音频段中每个音频帧的频谱数据输入时序注意力网络,得到每个参考音频帧的频谱数据对应的权重值;将每个参考音频帧的频谱数据与对应的权重值相乘,得到每个参考音频帧的调整后的频谱数据;根据每个参考音频帧的调整后的频谱数据、目标音频帧的频谱数据和去混响网络,确定去混响处理后的目标音频帧的音频数据。采用本申请,考虑到了目标音频帧中产生的混响与参考音频帧之间的相关性,综合考虑参考音频帧和目标音频帧,
音频处理方法、装置、设备和存储介质.pdf
本公开提供了一种音频处理方法、装置、设备和存储介质,涉及人工智能领域,尤其涉及语音技术领域。具体实现方案为:在接收到待处理音频时,确定待处理音频对应的目标发声方向;根据所述目标发声方向对应方向感重建滤波器,对所述待处理音频进行方向感重建,得到目标音频;输出所述目标音频。本公开实施例为线上参与方提供了线上沉浸式的沟通体验。
音频处理方法、装置、设备和存储介质.pdf
本申请公开了一种音频处理方法、装置、设备和存储介质,属于计算机技术领域。所述方法包括:将目标歌曲的多帧歌曲音频帧输入歌曲元素提取模型中,得到歌曲音频帧对应的第一类元素的初始音频帧;使用不同的增益系数对初始音频帧进行增益处理得到增益处理后的初始音频帧;确定歌曲音频帧与每个增益处理后的初始音频帧的差值音频帧,确定每个差值音频帧的响度值;在不同的增益系数中确定目标增益系数,确定第一类元素的目标音频帧;将各帧第一类元素的目标音频帧组成目标歌曲对应的第一类元素的音频片段。采用本申请,可以得到响度值更接近于实际响度值
音频分析方法、装置、计算设备和存储介质.pdf
本发明实施例公开了一种音频分析方法、装置、计算设备和存储介质,其中,该方法包括:对目标音频在多个采样周期内的音频片段分别进行强度识别,得到音频重音之间的至少一个重音时间间隔;对于每种重音时间间隔的出现情况进行统计,并根据统计结果确定每种重音时间间隔的权重,其中,每种重音时间间隔对应于时长匹配的至少一个重音时间间隔;将权重满足收敛条件的重音时间间隔,确定为目标音频的节拍间隔。本发明实施例可以提高音频节拍的识别准确性,更好地兼容不同的音乐风格,减小音频实时分析的计算量。
音频检索方法、装置和存储介质.pdf
本申请实施例公开了一种音频检索方法、装置和存储介质;本申请实施例可以获取待检索音频;对待检索音频进行声谱分析,得到待检索音频对应的整体声谱;对整体声谱进行音频指纹构造,得到待检索音频的音频指纹;根据待检索音频的音频指纹进行音频检索,得到检索结果;当检索结果未满足检索停止条件时,则对待检索音频的音频指纹进行更新,并返回执行根据待检索音频的音频指纹进行音频检索的步骤;当检索结果满足检索停止条件时,则停止检索,并输出检索结果。在本申请中,可以不断地更新音频指纹并根据该音频指纹进行音频检索,使得变调和/或变速后的