音频信号处理方法-豆柴文库

音频信号处理方法.pdf

2023-06-27

10金币

2.1MB

31页

努力****绮亦

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共31页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114495974A(43)申请公布日2022.05.13(21)申请号202210153017.5(22)申请日2022.02.18(71)申请人腾讯科技（深圳）有限公司地址518057广东省深圳市南山区高新区科技中一路腾讯大厦35层(72)发明人陈日林王震宇(74)专利代理机构北京市柳沈律师事务所11105专利代理师王娟(51)Int.Cl.G10L21/0272(2013.01)G10L25/30(2013.01)权利要求书2页说明书18页附图10页(54)发明名称音频信号处理方法(57)摘要公开了一种音频信号处理方法、一种音频信号处理装置、设备和计算机可读存储介质。本公开的各项实施例提供了一种盲源分离算法与神经网络联合相结合的自适应语音分离技术，不仅能够克服传统盲源分离算法在高混响情况下语音分离的结果不准确的问题，还能够克服传统的神经网络的运算复杂度过高和泛化能力差的问题。本公开的实施例能轻松地应用到任何一个两麦或多麦的车载/会议语音系统，扩展了语音分离技术的应用场景，实现了实时的语音分离效果。CN114495974ACN114495974A权利要求书1/2页1.一种音频信号处理方法，包括：基于来自至少一个声源的待处理音频信号，获取第一待处理音频数据集和第二待处理音频数据集；对所述第一待处理音频数据集进行预分离处理，以确定针对所述第一待处理音频数据集的第一估计信号；基于所述第一待处理音频数据集和所述针对第一待处理音频数据集的第一估计信号，确定针对所述第一待处理音频数据集的第二估计信号，以及基于针对所述第一待处理音频数据集的第二估计信号，对第二待处理音频数据集进行预分离处理。2.如权利要求1所述的方法，其中，所述对所述第一待处理音频数据集进行预分离处理，以确定针对所述第一待处理音频数据集的第一估计信号还包括：获取分离参数的初始值，并基于所述分离参数的初始值以及所述第一待处理音频数据集，通过多次迭代更新所述分离参数的值，以及基于更新后的分离参数的值，确定针对所述第一待处理音频数据集的第一估计信号，其中，所述第一估计信号包括至少一个信号分量，每个信号分量对应一个声源。3.如权利要求1所述的方法，其中，所述基于针对所述第一待处理音频数据集的第二估计信号，对第二待处理音频数据集进行预分离处理还包括：基于针对所述第一待处理音频数据集的第二估计信号，确定分离参数的初始值；基于所述分离参数的初始值以及所述第二待处理音频数据集，通过多次迭代更新所述分离参数的值，以及基于更新后的分离参数的值，确定针对所述第二待处理音频数据集的第一估计信号，其中，所述第一估计信号包括至少一个信号分量，每个信号分量对应一个声源。4.如权利要求1所述的方法，其中，所述基于所述第一待处理音频数据集和所述针对第一待处理音频数据集的第一估计信号，确定针对所述第一待处理音频数据集的第二估计信号还包括：基于所述第一待处理音频数据集和所述针对第一待处理音频数据集的第一估计信号，利用神经网络来确定针对所述第一待处理音频数据集的第二估计信号，其中，所述神经网络用于提供各个声源对应的待处理音频信号之间的差异信息或关联信息。5.如权利要求4所述的方法，其中，所述神经网络的训练样本包括混合信号样本、经预分离处理后的混合信号样本以及所述混合信号对应的源信号，所述神经网络的训练包括：基于所述混合信号以及所述经预分离处理后的混合信号样本，利用所述神经网络确定所述混合信号对应的估计信号；对所述神经网络中的各个神经元进行迭代更新，以所述混合信号对应的估计信号逼近所述混合信号对应的源信号。6.如权利要求1所述的方法，其中，所述方法还包括：在对第二待处理音频数据集进行预分离处理后，确定所述第二待处理音频数据集的第一估计信号；基于所述第二待处理音频数据集和所述针对第二待处理音频数据集的第一估计信号，确定针对所述第二待处理音频数据集的第二估计信号。2CN114495974A权利要求书2/2页7.如权利要求6所述的方法，其中，所述方法还包括：基于所述针对第一待处理音频数据集的第二估计信号，确定针对第一待处理音频数据集的目标信号片段，或者基于所述针对第一待处理音频数据集的第二估计信号，确定针对第二待处理音频数据集的目标信号片段；基于所述针对第一待处理音频数据集的目标信号片段或者所述针对第二待处理音频数据集的目标信号片段，确定目标信号；其中，所述目标信号包括至少一个目标信号分量，每个目标信号分量对应于一个声源。8.如权利要求1所述的方法，其中，每个声源对应的待处理音频信号为混合信号；或者每个声源对应的待处理音频信号为混合信号经回声消除处理或去混响处理后得到的信号；其中，所述混合信号为每个声源对应的源信号和干扰信号的线性或非线性叠加。9.如权利

相关资料

音频信号处理方法.pdf

公开了一种音频信号处理方法、一种音频信号处理装置、设备和计算机可读存储介质。本公开的各项实施例提供了一种盲源分离算法与神经网络联合相结合的自适应语音分离技术，不仅能够克服传统盲源分离算法在高混响情况下语音分离的结果不准确的问题，还能够克服传统的神经网络的运算复杂度过高和泛化能力差的问题。本公开的实施例能轻松地应用到任何一个两麦或多麦的车载/会议语音系统，扩展了语音分离技术的应用场景，实现了实时的语音分离效果。

2023-06-27

2.1MB

音频信号处理方法、音频信号处理装置及存储介质.pdf

本公开关于一种音频信号处理方法、音频信号处理装置及存储介质。音频信号处理方法包括：获取麦克风所采集的观测数据。响应于存在直达声和早期反射的协方差矩阵估计更新值，基于直达声和早期反射声的协方差矩阵估计更新值，对观测数据进行去混响处理，得到直达声和早期反射声的估计值。基于直达声和早期反射声的估计值，对多声源音频信号进行盲源分离处理，得到各声源的时域声源信号。通过本公开提供的音频信号处理方法，能够基于盲源分离算法，获取用于确定直达声和早期反射声的估计值的直达声和早期反射声的协方差矩阵，进而进行盲源分离得到各音频

2023-06-27

1.2MB

一种音频信号处理方法及音频信号处理装置.pdf

本发明公开了一种音频信号处理方法，包括：获取用户在运动过程中产生的步频参数；从终端中获取待处理的音频信号；根据步频参数对音频信号的节拍频率进行修改，使得修改后音频信号的节拍频率与步频参数之差小于预设阈值；输出修改后的音频信号。本发明还提供一种可以实现上述音频信号处理方法的终端。本发明能够保持音乐节拍频率与用户运动步频一致。

2023-12-06

722KB

对音频信号处理的装置和对时域音频信号进行处理的方法.pdf

本文涉及对音频信号处理的装置和对时域音频信号进行处理的方法。一种用于对音频信号进行处理的装置包括：包括M个分析滤波器的低延迟抽选分析滤波器组，其中，M大于1，并且其中，M个分析滤波器基于长度为N的不对称原型滤波器p

2023-06-26

7.7MB

处理音频信号的方法.pdf

本公开提供一种处理音频信号的方法、一种用户终端、一种电子设备、一种计算机可读存储介质以及一种计算机程序产品。例如，本公开能够对录音(尤其是对包含歌声的录音)进行智能降噪，其通过智能确定当前录音帧是否用于记录人声，并基于该确定的结果自适应地对录音中的不同片段应用不同的降噪方案，从而实现在抑制环境噪声的同时尽可能地保留录音中的人声信号。

2023-11-06

794KB