预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114255778A(43)申请公布日2022.03.29(21)申请号202111575514.6(22)申请日2021.12.21(71)申请人广州欢城文化传媒有限公司地址510000广东省广州市天河区平云路163号之二1701室(部位:自编之01室)(仅限办公)(72)发明人盘子圣马金龙熊佳焦南凯罗箫王伟喆曾锐鸿吴文亮黎子骏徐志坚谢睿陈光尧(74)专利代理机构北京集佳知识产权代理有限公司11227代理人李泽艳(51)Int.Cl.G10L21/0208(2013.01)G10L19/032(2013.01)权利要求书2页说明书9页附图4页(54)发明名称一种音频流降噪方法、装置、设备及存储介质(57)摘要本申请公开了一种音频流降噪方法、装置、设备及存储介质,该方法包括:针对待降噪的音频流的每一帧的音频数据:将其转换成频域数据,得到原始频谱数据;将原始频域数据输入至训练后的噪音识别模型,得到残差频谱数据;将原始频谱数据减去残差频谱数据,得到该帧的目标频谱数据;根据该帧的目标频谱数据,以及该帧的上一帧的目标频谱数据,获取该帧的目标音频数据;其中,该噪音识别模型为以带噪频谱数据作为训练样本、以噪音频谱数据作为样本标签训练得到。本申请在音频流的降噪处理过程中,以帧为单位实时地对每一帧数据进行处理,并结合上一帧的处理结果得到当前帧的降噪后的目标频谱数据,能够很好地处理直播等场景的音频流降噪问题。CN114255778ACN114255778A权利要求书1/2页1.一种音频流降噪方法,其特征在于,包括:针对待降噪的音频流的每一帧的音频数据:将所述帧的音频数据转换成频域数据,得到原始频谱数据;将所述原始频域数据输入至训练后的噪音识别模型,得到残差频谱数据;将所述原始频谱数据减去所述残差频谱数据,得到所述帧的目标频谱数据;根据所述帧的目标频谱数据,以及所述帧的上一帧的目标频谱数据,获取所述帧的目标音频数据;其中,所述噪音识别模型为以带噪频谱数据作为训练样本、以噪音频谱数据作为样本标签训练得到。2.根据权利要求1所述的方法,其特征在于,所述噪音识别模型训练的过程,包括:获取预设数目份语音片段数据及预设数目份噪音片段数据;根据所述语音片段数据及所述噪音片段数据,获取预设数目份带噪频谱数据及预设数目份噪音频谱数据;以预设数目份带噪频谱数据作为所述噪音识别模型的训练样本,以预设数目份噪音频谱数据作为样本标签,对所述噪音识别模型进行训练。3.根据权利要求2所述的方法,其特征在于,根据所述语音片段数据及所述噪音片段数据,获取预设数目份带噪频谱数据及预设数目份噪音频谱数据的过程,包括:对所述语音片段数据及所述噪音片段数据进行一一配对,得到预设数目组片段数据;针对每一组片段数据:分别对语音片段数据及噪音片段数据进行音量调整及低通滤波,得到第一语音片段数据及第一噪音片段数据;将第一语音片段数据及第一噪音片段数据进行混合,得到带噪片段数据;对所述带噪片段数据进行分帧加窗及傅立叶变换,得到带噪频谱数据;对所述第一语音片段数据进行分帧加窗及傅立叶变换,得到语音频谱数据;将所述带噪频谱数据减去所述语音频谱数据,得到噪音频谱数据。4.根据权利要求3所述的方法,其特征在于,分别对语音片段数据及噪音片段数据进行音量调整及低通滤波,得到第一语音片段数据及第一噪音片段数据的过程,包括:对于同一组片段数据里的语音片段数据及噪音片段数据,采用固定的信噪比进行音量调整,得到音量调整后的语音片段数据及音量调整后的噪音片段数据,所述信噪比的范围在‑5dB~20dB之间;分别对音量调整后的语音片段数据及音量调整后的噪音片段数据进行低通滤波,得到第一语音片段数据及第一噪音片段数据。5.根据权利要求1所述的方法,其特征在于,将所述帧的音频数据转换成频域数据,得到原始频谱数据的过程,包括:对所述帧的音频数据进行采样,得到音频采样数据;将所述音频采样数据转换成频域数据,得到原始频谱数据。6.根据权利要求5所述的方法,其特征在于,将所述音频采样数据转换成频域数据,得到原始频谱数据的过程,包括:将所述音频采样数据与汉宁窗函数相乘,得到处理后的音频数据;2CN114255778A权利要求书2/2页对所述处理后的音频数据进行傅立叶变换,得到原始频谱数据。7.根据权利要求1~6中任一项所述的方法,其特征在于,根据所述帧的目标频谱数据,以及所述帧的上一帧的目标频谱数据,获取所述帧的目标音频数据的过程,包括:分别对所述帧的目标频谱数据、所述帧的上一帧的目标频谱数据进行傅立叶逆变换,得到所述帧的候选音频数据以及所述帧的上一帧的候选音频数据;对所述帧的候选音频数据以及所述帧的上一帧的候选音频数据进行1/2窗口长度的重叠相加卷积运算,