预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共31页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114495974A(43)申请公布日2022.05.13(21)申请号202210153017.5(22)申请日2022.02.18(71)申请人腾讯科技(深圳)有限公司地址518057广东省深圳市南山区高新区科技中一路腾讯大厦35层(72)发明人陈日林王震宇(74)专利代理机构北京市柳沈律师事务所11105专利代理师王娟(51)Int.Cl.G10L21/0272(2013.01)G10L25/30(2013.01)权利要求书2页说明书18页附图10页(54)发明名称音频信号处理方法(57)摘要公开了一种音频信号处理方法、一种音频信号处理装置、设备和计算机可读存储介质。本公开的各项实施例提供了一种盲源分离算法与神经网络联合相结合的自适应语音分离技术,不仅能够克服传统盲源分离算法在高混响情况下语音分离的结果不准确的问题,还能够克服传统的神经网络的运算复杂度过高和泛化能力差的问题。本公开的实施例能轻松地应用到任何一个两麦或多麦的车载/会议语音系统,扩展了语音分离技术的应用场景,实现了实时的语音分离效果。CN114495974ACN114495974A权利要求书1/2页1.一种音频信号处理方法,包括:基于来自至少一个声源的待处理音频信号,获取第一待处理音频数据集和第二待处理音频数据集;对所述第一待处理音频数据集进行预分离处理,以确定针对所述第一待处理音频数据集的第一估计信号;基于所述第一待处理音频数据集和所述针对第一待处理音频数据集的第一估计信号,确定针对所述第一待处理音频数据集的第二估计信号,以及基于针对所述第一待处理音频数据集的第二估计信号,对第二待处理音频数据集进行预分离处理。2.如权利要求1所述的方法,其中,所述对所述第一待处理音频数据集进行预分离处理,以确定针对所述第一待处理音频数据集的第一估计信号还包括:获取分离参数的初始值,并基于所述分离参数的初始值以及所述第一待处理音频数据集,通过多次迭代更新所述分离参数的值,以及基于更新后的分离参数的值,确定针对所述第一待处理音频数据集的第一估计信号,其中,所述第一估计信号包括至少一个信号分量,每个信号分量对应一个声源。3.如权利要求1所述的方法,其中,所述基于针对所述第一待处理音频数据集的第二估计信号,对第二待处理音频数据集进行预分离处理还包括:基于针对所述第一待处理音频数据集的第二估计信号,确定分离参数的初始值;基于所述分离参数的初始值以及所述第二待处理音频数据集,通过多次迭代更新所述分离参数的值,以及基于更新后的分离参数的值,确定针对所述第二待处理音频数据集的第一估计信号,其中,所述第一估计信号包括至少一个信号分量,每个信号分量对应一个声源。4.如权利要求1所述的方法,其中,所述基于所述第一待处理音频数据集和所述针对第一待处理音频数据集的第一估计信号,确定针对所述第一待处理音频数据集的第二估计信号还包括:基于所述第一待处理音频数据集和所述针对第一待处理音频数据集的第一估计信号,利用神经网络来确定针对所述第一待处理音频数据集的第二估计信号,其中,所述神经网络用于提供各个声源对应的待处理音频信号之间的差异信息或关联信息。5.如权利要求4所述的方法,其中,所述神经网络的训练样本包括混合信号样本、经预分离处理后的混合信号样本以及所述混合信号对应的源信号,所述神经网络的训练包括:基于所述混合信号以及所述经预分离处理后的混合信号样本,利用所述神经网络确定所述混合信号对应的估计信号;对所述神经网络中的各个神经元进行迭代更新,以所述混合信号对应的估计信号逼近所述混合信号对应的源信号。6.如权利要求1所述的方法,其中,所述方法还包括:在对第二待处理音频数据集进行预分离处理后,确定所述第二待处理音频数据集的第一估计信号;基于所述第二待处理音频数据集和所述针对第二待处理音频数据集的第一估计信号,确定针对所述第二待处理音频数据集的第二估计信号。2CN114495974A权利要求书2/2页7.如权利要求6所述的方法,其中,所述方法还包括:基于所述针对第一待处理音频数据集的第二估计信号,确定针对第一待处理音频数据集的目标信号片段,或者基于所述针对第一待处理音频数据集的第二估计信号,确定针对第二待处理音频数据集的目标信号片段;基于所述针对第一待处理音频数据集的目标信号片段或者所述针对第二待处理音频数据集的目标信号片段,确定目标信号;其中,所述目标信号包括至少一个目标信号分量,每个目标信号分量对应于一个声源。8.如权利要求1所述的方法,其中,每个声源对应的待处理音频信号为混合信号;或者每个声源对应的待处理音频信号为混合信号经回声消除处理或去混响处理后得到的信号;其中,所述混合信号为每个声源对应的源信号和干扰信号的线性或非线性叠加。9.如权利