预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109994127A(43)申请公布日2019.07.09(21)申请号201910304571.7(22)申请日2019.04.16(71)申请人腾讯音乐娱乐科技(深圳)有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(72)发明人陈洲旋(74)专利代理机构北京三高永信知识产权代理有限责任公司11138代理人关越(51)Int.Cl.G10L25/03(2013.01)G10L25/78(2013.01)权利要求书2页说明书13页附图5页(54)发明名称音频检测方法、装置、电子设备及存储介质(57)摘要本发明公开了一种音频检测方法、装置、电子设备及存储介质,属于数字音频处理技术领域。本发明实施例可以基于音频文件中的音频帧的能量值、过零率、权重频谱值、频谱平坦度以及音频帧与前一个音频帧之间的线性相关系数等特征参数,来检测该音频帧是否存在突发白噪声,当判断音频帧的能量值大于第一阈值、过零率大于第二阈值、权重频谱值大于第三阈值、频谱平坦度大于第四阈值且该音频帧与前一个音频帧之间的线性相关系数小于第五阈值时,则可以确定检测到该音频帧存在突发白噪声,基于该音频检测方法,可以检测任意类型的音频文件中是否存在突发白噪声,且,基于上述多个特征参数,使得检测结果的准确率较高,该检测方法的鲁棒性较高。CN109994127ACN109994127A权利要求书1/2页1.一种音频检测方法,其特征在于,所述方法包括:基于音频文件中的音频帧,分别获取所述音频帧的能量值、过零率和权重频谱值;当所述能量值大于第一阈值、所述过零率大于第二阈值且所述权重频谱值大于第三阈值时,获取所述音频帧的频谱平坦度;当所述频谱平坦度大于第四阈值时,基于所述音频帧和所述音频帧的前一个音频帧,获取所述音频帧的时域信号与所述前一个音频帧的时域信号之间的线性相关系数;当所述线性相关系数小于第五阈值时,确定所述音频帧存在突发白噪声。2.根据权利要求1所述的方法,其特征在于,所述获取所述音频帧的频谱平坦度包括:对所述音频帧进行时频变换,获取所述音频帧的频谱;基于所述频谱,获取所述频谱的几何平均数和算术平均数;基于所述几何平均数和所述算术平均数,获取所述频谱平坦度。3.根据权利要求1所述的方法,其特征在于,所述基于所述音频帧和所述音频帧的前一个音频帧,获取所述音频帧的时域信号与所述前一个音频帧的时域信号之间的线性相关系数包括:基于所述音频帧的时域信号的各个第一幅值,以及所述前一个音频帧的时域信号的各个第二幅值,获取所述音频帧的时域信号和所述前一个音频帧的时域信号之间的协方差;获取所述各个第一幅值的第一方差和所述各个第二幅值的第二方差;基于所述协方差、所述第一方差和所述第二方差,获取所述线性相关系数。4.根据权利要求1所述的方法,其特征在于,所述确定所述音频帧存在突发白噪声之后,所述方法还包括:当连续确定多个音频帧存在所述突发白噪声时,确定检测到所述多个音频帧对应的音频片段存在所述突发白噪声。5.根据权利要求1所述的方法,其特征在于,所述确定所述音频帧存在突发白噪声之后,所述方法还包括:基于存在所述突发白噪声的多个所述音频帧,训练机器学习模型,所述机器学习模型用于自动识别任一音频文件中存在所述突发白噪声的音频帧。6.一种音频检测装置,其特征在于,所述装置包括:第一获取模块,用于基于音频文件中的音频帧,分别获取所述音频帧的能量值、过零率和权重频谱值;第二获取模块,用于当所述能量值大于第一阈值、所述过零率大于第二阈值且所述权重频谱值大于第三阈值时,获取所述音频帧的频谱平坦度;第三获取模块,用于当所述频谱平坦度大于第四阈值时,基于所述音频帧和所述音频帧的前一个音频帧,获取所述音频帧的时域信号与所述前一个音频帧的时域信号之间的线性相关系数;确定模块,用于当所述线性相关系数小于第五阈值时,确定所述音频帧存在突发白噪声。7.根据权利要求6所述的装置,其特征在于,所述第二获取模块用于:对所述音频帧进行时频变换,获取所述音频帧的频谱;基于所述频谱,获取所述频谱的几何平均数和算术平均数;2CN109994127A权利要求书2/2页基于所述几何平均数和所述算术平均数,获取所述频谱平坦度。8.根据权利要求6所述的装置,其特征在于,所述第三获取模块用于:基于所述音频帧的时域信号的各个第一幅值,以及所述前一个音频帧的时域信号的各个第二幅值,获取所述音频帧的时域信号和所述前一个音频帧的时域信号之间的协方差;获取所述各个第一幅值的第一方差和所述各个第二幅值的第二方差;基于所述协方差、所述第一方差和所述第二方差,获取所述线性相关系数。9.根据权利要求6所述的装置,其特征在于,所述装置还包括:所述确定模块,还用于当连续