音频检测方法、装置、电子设备及存储介质-豆柴文库

音频检测方法、装置、电子设备及存储介质.pdf

2023-12-04

10金币

945KB

21页

An****70

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共21页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109994127A(43)申请公布日2019.07.09(21)申请号201910304571.7(22)申请日2019.04.16(71)申请人腾讯音乐娱乐科技（深圳）有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(72)发明人陈洲旋(74)专利代理机构北京三高永信知识产权代理有限责任公司11138代理人关越(51)Int.Cl.G10L25/03(2013.01)G10L25/78(2013.01)权利要求书2页说明书13页附图5页(54)发明名称音频检测方法、装置、电子设备及存储介质(57)摘要本发明公开了一种音频检测方法、装置、电子设备及存储介质，属于数字音频处理技术领域。本发明实施例可以基于音频文件中的音频帧的能量值、过零率、权重频谱值、频谱平坦度以及音频帧与前一个音频帧之间的线性相关系数等特征参数，来检测该音频帧是否存在突发白噪声，当判断音频帧的能量值大于第一阈值、过零率大于第二阈值、权重频谱值大于第三阈值、频谱平坦度大于第四阈值且该音频帧与前一个音频帧之间的线性相关系数小于第五阈值时，则可以确定检测到该音频帧存在突发白噪声，基于该音频检测方法，可以检测任意类型的音频文件中是否存在突发白噪声，且，基于上述多个特征参数，使得检测结果的准确率较高，该检测方法的鲁棒性较高。CN109994127ACN109994127A权利要求书1/2页1.一种音频检测方法，其特征在于，所述方法包括：基于音频文件中的音频帧，分别获取所述音频帧的能量值、过零率和权重频谱值；当所述能量值大于第一阈值、所述过零率大于第二阈值且所述权重频谱值大于第三阈值时，获取所述音频帧的频谱平坦度；当所述频谱平坦度大于第四阈值时，基于所述音频帧和所述音频帧的前一个音频帧，获取所述音频帧的时域信号与所述前一个音频帧的时域信号之间的线性相关系数；当所述线性相关系数小于第五阈值时，确定所述音频帧存在突发白噪声。2.根据权利要求1所述的方法，其特征在于，所述获取所述音频帧的频谱平坦度包括：对所述音频帧进行时频变换，获取所述音频帧的频谱；基于所述频谱，获取所述频谱的几何平均数和算术平均数；基于所述几何平均数和所述算术平均数，获取所述频谱平坦度。3.根据权利要求1所述的方法，其特征在于，所述基于所述音频帧和所述音频帧的前一个音频帧，获取所述音频帧的时域信号与所述前一个音频帧的时域信号之间的线性相关系数包括：基于所述音频帧的时域信号的各个第一幅值，以及所述前一个音频帧的时域信号的各个第二幅值，获取所述音频帧的时域信号和所述前一个音频帧的时域信号之间的协方差；获取所述各个第一幅值的第一方差和所述各个第二幅值的第二方差；基于所述协方差、所述第一方差和所述第二方差，获取所述线性相关系数。4.根据权利要求1所述的方法，其特征在于，所述确定所述音频帧存在突发白噪声之后，所述方法还包括：当连续确定多个音频帧存在所述突发白噪声时，确定检测到所述多个音频帧对应的音频片段存在所述突发白噪声。5.根据权利要求1所述的方法，其特征在于，所述确定所述音频帧存在突发白噪声之后，所述方法还包括：基于存在所述突发白噪声的多个所述音频帧，训练机器学习模型，所述机器学习模型用于自动识别任一音频文件中存在所述突发白噪声的音频帧。6.一种音频检测装置，其特征在于，所述装置包括：第一获取模块，用于基于音频文件中的音频帧，分别获取所述音频帧的能量值、过零率和权重频谱值；第二获取模块，用于当所述能量值大于第一阈值、所述过零率大于第二阈值且所述权重频谱值大于第三阈值时，获取所述音频帧的频谱平坦度；第三获取模块，用于当所述频谱平坦度大于第四阈值时，基于所述音频帧和所述音频帧的前一个音频帧，获取所述音频帧的时域信号与所述前一个音频帧的时域信号之间的线性相关系数；确定模块，用于当所述线性相关系数小于第五阈值时，确定所述音频帧存在突发白噪声。7.根据权利要求6所述的装置，其特征在于，所述第二获取模块用于：对所述音频帧进行时频变换，获取所述音频帧的频谱；基于所述频谱，获取所述频谱的几何平均数和算术平均数；2CN109994127A权利要求书2/2页基于所述几何平均数和所述算术平均数，获取所述频谱平坦度。8.根据权利要求6所述的装置，其特征在于，所述第三获取模块用于：基于所述音频帧的时域信号的各个第一幅值，以及所述前一个音频帧的时域信号的各个第二幅值，获取所述音频帧的时域信号和所述前一个音频帧的时域信号之间的协方差；获取所述各个第一幅值的第一方差和所述各个第二幅值的第二方差；基于所述协方差、所述第一方差和所述第二方差，获取所述线性相关系数。9.根据权利要求6所述的装置，其特征在于，所述装置还包括：所述确定模块，还用于当连续

相关资料

音频检测方法、装置、电子设备及存储介质.pdf

本发明公开了一种音频检测方法、装置、电子设备及存储介质，属于数字音频处理技术领域。本发明实施例可以基于音频文件中的音频帧的能量值、过零率、权重频谱值、频谱平坦度以及音频帧与前一个音频帧之间的线性相关系数等特征参数，来检测该音频帧是否存在突发白噪声，当判断音频帧的能量值大于第一阈值、过零率大于第二阈值、权重频谱值大于第三阈值、频谱平坦度大于第四阈值且该音频帧与前一个音频帧之间的线性相关系数小于第五阈值时，则可以确定检测到该音频帧存在突发白噪声，基于该音频检测方法，可以检测任意类型的音频文件中是否存在突发白噪

2023-12-04

945KB

无损音频检测方法、装置、电子设备及存储介质.pdf

本申请公开了一种无损音频检测方法、装置、电子设备及存储介质，以提高无损音频的检测准确度。该方法包括：获取待检测音频对应的频谱图；将频谱图输入已训练的神经网络模型，得到表示待检测音频是否为无损音频的检测结果，神经网络模型包括卷积神经网络、时间递归神经网络、注意力模块和分类器；卷积神经网络用于从频谱图提取预设数量个第一特征向量；时间递归神经网络用于根据顺序输入的预设数量个第一特征向量依次输出预设数量个第二特征向量；注意力模块用于根据预设数量个第二特征向量获得每个第二特征向量对应的权重；分类器用于根据预设数量个

2023-12-03

1MB

音频异常检测方法、装置、电子设备及存储介质.pdf

本发明的实施例提供了一种音频异常检测方法、装置、电子设备及存储介质,涉及数据处理领域。本申请提供的音频异常检测方法,构建初始检测模型;对初始打卡音频数据进行处理,生成音频特征张量;将音频特征张量输入初始检测模型,输出第一随机变量和第二随机变量;根据优化函数对初始检测模型进行训练,得到修正检测模型;将第一随机变量和第二随机变量输入修正检测模型,生成重构张量;对重构张量进行异常评估计算,得到异常分数;若异常分数大于或等于异常阈值,则确定初始打卡音频数据存在异常。本实施例对时间和空间数据进行联合编码,可用于监测

2023-05-25

804KB

音频检测方法、装置及存储介质.pdf

本发明公开了一种音频检测方法、装置及存储介质，所述方法包括：对待测音频进行预筛选处理，以筛选出所述待测音频中的候选音频片段，并将所述候选音频片段输入训练好的局部识别模型中进行音频的断点检测，以生成所述候选音频片段的检测结果，再根据所述候选音频片段的检测结果确定所述待测音频是否具有断点。本发明实施例通过预筛选处理筛选出待测音频中可能存在断点的候选音频片段，然后利用训练好的局部识别模型进行音频的断点检测，提升了音频断点检测的准确率和召回率，并提升对节奏类假断点的鲁棒性，能够有效检测音频的断点。

2023-12-04

1.3MB

音频检测方法、装置及存储介质.pdf

本发明公开了一种音频检测方法、装置及存储介质，所述方法包括：获取待测音频信号以及所述待测音频信号的声道数，其中，所述待测音频信号为声道数不小于2的音频信号，并根据所述待测音频信号的声道数对所述待测音频信号进行预处理，以得到双声道处理信号，然后计算所述双声道处理信号的能量值，并根据所述双声道处理信号的能量值进行声道反相的检测，能够有效检测待测音频信号中的声道反相。

2023-12-04

735KB