处理音频信号的方法-豆柴文库

处理音频信号的方法.pdf

2023-11-06

10金币

794KB

27页

是你****辉呀

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共27页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114333874A(43)申请公布日2022.04.12(21)申请号202111387922.9(22)申请日2021.11.22(71)申请人腾讯科技（深圳）有限公司地址518057广东省深圳市南山区高新区科技中一路腾讯大厦35层(72)发明人梁俊斌(74)专利代理机构北京市柳沈律师事务所11105代理人王娟(51)Int.Cl.G10L21/0208(2013.01)G10L21/028(2013.01)G10L25/81(2013.01)权利要求书3页说明书16页附图7页(54)发明名称处理音频信号的方法(57)摘要本公开提供一种处理音频信号的方法、一种用户终端、一种电子设备、一种计算机可读存储介质以及一种计算机程序产品。例如，本公开能够对录音(尤其是对包含歌声的录音)进行智能降噪，其通过智能确定当前录音帧是否用于记录人声，并基于该确定的结果自适应地对录音中的不同片段应用不同的降噪方案，从而实现在抑制环境噪声的同时尽可能地保留录音中的人声信号。CN114333874ACN114333874A权利要求书1/3页1.一种处理音频信号的方法，包括：获取包括多个录音音频帧的音频信号，确定当前录音音频帧对应的时间戳；基于当前录音音频帧对应的时间戳，确定当前录音音频帧是否用于记录人声；响应于当前录音音频帧用于记录人声，对当前录音音频帧进行第一降噪处理，或者响应于当前录音音频帧不用于记录人声，对当前录音音频帧进行第二降噪处理，其中，所述第一降噪处理对噪声的抑制能力高于所述第二降噪处理对噪声的抑制能力。2.如权利要求1所述的方法，其中，所述第一降噪处理为深度学习降噪处理，所述第二降噪处理为统计降噪处理。3.如权利要求2所述的方法，其中，所述对当前录音音频帧进行第一降噪处理包括：至少部分地基于降噪神经网络，确定所述当前录音音频帧的各个频点对应的降噪增益值；其中，所述降噪神经网络的训练样本包括由噪声音频信号和人声音频信号合成的带噪音频样本。4.如权利要求3所述的方法，其中，所述降噪神经网络包括输入层、人声检测层、噪声谱估计层、噪声消除层，其中，所述输入层的输入为音频帧，输出为所述音频帧对应的音频特征；所述人声检测层的输入为所述音频帧对应的音频特征，输出为人声概率特征；所述噪声谱估计层的输入为所述音频帧对应的音频特征、所述人声概率特征，输出为噪声估计特征；以及所述噪声消除层的输入为所述音频帧对应的音频特征、所述人声概率特征以及所述噪声估计特征，输出为各个频点对应的降噪增益值。5.如权利要求2所述的方法，其中，所述对当前录音音频帧进行第二降噪处理包括：至少部分地基于平稳噪声的统计分布和平稳特性，确定所述当前录音音频帧的各个频点对应的降噪增益值。6.如权利要求5所述的方法，其中，所述确定所述当前录音音频帧的各个频点对应的降噪增益值还包括：对于所述当前录音音频帧的每个频点，基于在先前的多个录音音频帧中统计的所述频点处平稳噪声的功率占总功率的比值，确定所述当前录音音频帧的各个频点对应的降噪增益值。7.如权利要求5所述的方法，其中，所述确定所述当前录音音频帧的各个频点对应的降噪增益值还包括：至少部分地基于平稳噪声的统计分布和平稳特性，确定所述第二降噪处理对应的维纳滤波器；基于所述维纳滤波器，确定所述当前录音音频帧的各个频点对应的降噪增益值。8.如权利要求1所述的方法，其中，所述当前录音音频帧是否用于记录人声是至少部分地基于从参考音源数据中提取的第一参考信号来确定的，所述第一参考信号的提取包括：从参考音源数据中去除伴奏音源数据以获取原唱音源数据；2CN114333874A权利要求书2/3页基于原唱音源数据，确定原唱对应多个起始时刻；基于所述多个起始时刻，确定所述第一参考信号。9.如权利要求1所述的方法，其中，所述当前录音音频帧是否用于记录人声是至少部分地基于从参考音源数据中提取的第二参考信号来确定的，所述第二参考信号的提取包括：从参考音源数据中去除伴奏音源数据以获取原唱音源数据；基于原唱音源数据，确定原唱对应多个暂停时刻或终止时刻；基于所述多个暂停时刻或终止时刻，确定所述第二参考信号。10.一种处理音频信号的方法，包括：获取包括多个录音音频帧的音频信号，响应于当前录音音频帧中包含人声的概率大于等于预定阈值，从对当前录音音频帧进行第一降噪处理切换为对当前录音音频帧进行第二降噪处理；或者响应于当前录音音频帧中包含人声的概率小于预定阈值，从对当前录音音频帧进行第二降噪处理切换为对当前录音音频帧进行第一降噪处理；其中，所述第一降噪处理对噪声的抑制能力高于所述第二降噪处理对噪声的抑制能力。11.一种用户终端，包括音频捕获电路和音频处理电路，其中，所述音频捕获电路被配置为获取包括多个录

相关资料

音频信号处理方法.pdf

公开了一种音频信号处理方法、一种音频信号处理装置、设备和计算机可读存储介质。本公开的各项实施例提供了一种盲源分离算法与神经网络联合相结合的自适应语音分离技术，不仅能够克服传统盲源分离算法在高混响情况下语音分离的结果不准确的问题，还能够克服传统的神经网络的运算复杂度过高和泛化能力差的问题。本公开的实施例能轻松地应用到任何一个两麦或多麦的车载/会议语音系统，扩展了语音分离技术的应用场景，实现了实时的语音分离效果。

2023-06-27

2.1MB

音频信号处理方法、音频信号处理装置及存储介质.pdf

本公开关于一种音频信号处理方法、音频信号处理装置及存储介质。音频信号处理方法包括：获取麦克风所采集的观测数据。响应于存在直达声和早期反射的协方差矩阵估计更新值，基于直达声和早期反射声的协方差矩阵估计更新值，对观测数据进行去混响处理，得到直达声和早期反射声的估计值。基于直达声和早期反射声的估计值，对多声源音频信号进行盲源分离处理，得到各声源的时域声源信号。通过本公开提供的音频信号处理方法，能够基于盲源分离算法，获取用于确定直达声和早期反射声的估计值的直达声和早期反射声的协方差矩阵，进而进行盲源分离得到各音频

2023-06-27

1.2MB

一种音频信号处理方法及音频信号处理装置.pdf

本发明公开了一种音频信号处理方法，包括：获取用户在运动过程中产生的步频参数；从终端中获取待处理的音频信号；根据步频参数对音频信号的节拍频率进行修改，使得修改后音频信号的节拍频率与步频参数之差小于预设阈值；输出修改后的音频信号。本发明还提供一种可以实现上述音频信号处理方法的终端。本发明能够保持音乐节拍频率与用户运动步频一致。

2023-12-06

722KB

对音频信号处理的装置和对时域音频信号进行处理的方法.pdf

本文涉及对音频信号处理的装置和对时域音频信号进行处理的方法。一种用于对音频信号进行处理的装置包括：包括M个分析滤波器的低延迟抽选分析滤波器组，其中，M大于1，并且其中，M个分析滤波器基于长度为N的不对称原型滤波器p

2023-06-26

7.7MB

处理音频信号的方法.pdf

本公开提供一种处理音频信号的方法、一种用户终端、一种电子设备、一种计算机可读存储介质以及一种计算机程序产品。例如，本公开能够对录音(尤其是对包含歌声的录音)进行智能降噪，其通过智能确定当前录音帧是否用于记录人声，并基于该确定的结果自适应地对录音中的不同片段应用不同的降噪方案，从而实现在抑制环境噪声的同时尽可能地保留录音中的人声信号。

2023-11-06

794KB