预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共27页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN109256147A(43)申请公布日2019.01.22(21)申请号201811278954.3(22)申请日2018.10.30(71)申请人腾讯音乐娱乐科技(深圳)有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(72)发明人王征韬(74)专利代理机构深圳翼盛智成知识产权事务所(普通合伙)44300代理人黄威(51)Int.Cl.G10L25/51(2013.01)G10L25/30(2013.01)权利要求书4页说明书15页附图7页(54)发明名称音频节拍检测方法、装置及存储介质(57)摘要本发明公开了一种音频节拍检测方法、装置及存储介质,所述方法包括:获取训练样本,并对所述训练样本进行特征提取,以提取出所述训练样本的音频特征,再将所述训练样本的音频特征输入参考模型中进行学习训练,以得到训练后的所述参考模型的优化参数,且根据所述优化参数生成检测模型,然后基于所述检测模型对待测音频进行音频节拍检测,以获取所述待测音频的BPM值以及所述BPM值对应的置信度,提升了音频节拍检测的准确率,且能缩短检测过程中的运行时间。CN109256147ACN109256147A权利要求书1/4页1.一种音频节拍检测方法,其特征在于,所述方法包括:获取训练样本;对所述训练样本进行特征提取,以提取出所述训练样本的音频特征;将所述训练样本的音频特征输入参考模型中进行学习训练,以得到训练后的所述参考模型的优化参数;根据所述优化参数生成检测模型;基于所述检测模型对待测音频进行音频节拍检测,以获取所述待测音频的BPM值以及所述BPM值对应的置信度。2.如权利要求1所述的音频节拍检测方法,其特征在于,所述基于所述检测模型对待测音频进行音频节拍检测,以获取所述待测音频的BPM值以及所述BPM值对应的置信度,包括:按照预设时间长度从所述待测音频中截取多个音频片段;将所述多个音频片段分别输入所述检测模型中进行音频节拍检测,以获得所述多个音频片段中每一音频片段的预测结果,其中,所述每一音频片段的预测结果包括多个BPM值以及每一所述BPM值对应的置信度;对所述预测结果进行多段投票,以获取所述待测音频的BPM值以及所述BPM值对应的置信度。3.如权利要求2所述的音频节拍检测方法,其特征在于,若所述检测模型包括单模型,则所述对所述预测结果进行多段投票,以获取所述待测音频的BPM值以及所述BPM值对应的置信度,包括:从所述多个音频片段的每一音频片段的预测结果中选取置信度排名达到预设名次的BPM值以及所述置信度排名达到预设名次的BPM值对应的置信度;根据所述置信度排名达到预设名次的BPM值以及所述置信度排名达到预设名次的BPM值对应的置信度,确定所述待测音频的BPM值以及所述BPM值对应的置信度。4.如权利要求2所述的音频节拍检测方法,其特征在于,若所述检测模型包括多模型,则所述对所述预测结果进行多段投票,以获取所述待测音频的BPM值以及所述BPM值对应的置信度,包括:从所述多个音频片段的每一音频片段的预测结果中选取所述多模型中每一模型对应的数据集,其中,所述每一模型对应的数据集包括同一模型输出的多个BPM值以及每一所述BPM值对应的置信度;分别对所述多模型中每一模型对应的数据集进行投票,以从所述多模型中每一模型对应的数据集中选取置信度最高的数据集;根据所述置信度最高的数据集,确定所述待测音频的BPM值以及所述BPM值对应的置信度。5.如权利要求1所述的音频节拍检测方法,其特征在于,所述对所述训练样本进行特征提取,以提取出所述训练样本的音频特征,包括:按照预设步长以及预设帧长对所述训练样本进行分帧处理,以得到多帧信号;对所述多帧信号进行信号变换,以得到与所述多帧信号对应的多个基本信号;从所述多个基本信号中导出与所述多个基本信号对应的多个导出信号;按照时间序列将所述多个基本信号与所述多个导出信号进行向量堆叠,以得到所述训2CN109256147A权利要求书2/4页练样本的音频特征。6.如权利要求5所述的音频节拍检测方法,其特征在于,所述对所述多帧信号进行信号变换,以得到与所述多帧信号对应的多个基本信号,包括:对所述多帧信号中的每一帧信号进行傅里叶变换,并对所述傅里叶变换的实部对应的信号频率进行梅尔尺度变换,以得到每一帧信号的梅尔频谱;将所述每一帧信号的梅尔频谱输入对数函数中进行计算,以得到所述多帧信号中每一帧信号对应的基本信号;所述从所述多个基本信号中导出与所述多个基本信号对应的多个导出信号,包括:沿每一所述基本信号的频率方向分别进行中值滤波,以获取每一所述基本信号对应的中值滤波结果;将每一所述基本信号减去与其对应的所述中值滤波结果,以得到每一所述基本信号对应的中间值