预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共33页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111312297A(43)申请公布日2020.06.19(21)申请号202010093308.0(22)申请日2020.02.14(71)申请人腾讯音乐娱乐科技(深圳)有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(72)发明人徐东(74)专利代理机构深圳翼盛智成知识产权事务所(普通合伙)44300代理人蔡艾莹(51)Int.Cl.G11B20/10(2006.01)G11B27/031(2006.01)G11B27/36(2006.01)权利要求书3页说明书21页附图8页(54)发明名称音频处理方法、装置、存储介质及电子设备(57)摘要本申请公开了一种音频处理方法,包括:获取歌曲音频以及该歌曲音频对应的伴奏音频;若该歌曲音频和该伴奏音频的采样率不一致,则对该歌曲音频和该伴奏音频的采样率进行预设处理,以使该歌曲音频和该伴奏音频的采样率一致;对采样率一致的该歌曲音频和该伴奏音频进行音频特征检测,得到音频特征检测结果;提取该歌曲音频的第一音频指纹信息以及该伴奏音频的第二音频指纹信息,并对该第一音频指纹信息和该第二音频指纹信息进行匹配,得到音频指纹信息匹配结果;根据该音频特征检测结果和该音频指纹信息匹配结果,输出该歌曲音频和该伴奏音频的时间偏移值。本申请可以准确检测出完整歌曲和相应的伴奏之间的时间偏移值。CN111312297ACN111312297A权利要求书1/3页1.一种音频处理方法,其特征在于,包括:获取歌曲音频以及所述歌曲音频对应的伴奏音频;若所述歌曲音频和所述伴奏音频的采样率不一致,则对所述歌曲音频和所述伴奏音频的采样率进行预设处理,以使所述歌曲音频和所述伴奏音频的采样率一致;对采样率一致的所述歌曲音频和所述伴奏音频进行音频特征检测,得到音频特征检测结果,所述音频特征检测包括播放时长差检测、音频帧功率差检测、端点静音时长差检测、鼓点同步数量检测中的至少一种;提取所述歌曲音频的第一音频指纹信息以及所述伴奏音频的第二音频指纹信息,并对所述第一音频指纹信息和所述第二音频指纹信息进行匹配,得到音频指纹信息匹配结果;根据所述音频特征检测结果和所述音频指纹信息匹配结果,输出所述歌曲音频和所述伴奏音频的时间偏移值。2.根据权利要求1所述的音频处理方法,其特征在于,提取所述歌曲音频的第一音频指纹信息以及所述伴奏音频的第二音频指纹信息,包括:将所述歌曲音频划分为多个歌曲音频帧,得到歌曲音频帧序列;获取所述歌曲音频帧序列中的每一歌曲音频帧的音频指纹信息,得到对应的歌曲音频指纹信息序列,并将所述歌曲音频指纹信息序列确定为第一音频指纹信息;将所述伴奏音频划分为多个伴奏音频帧,得到伴奏音频帧序列;获取所述伴奏音频帧序列中的每一伴奏音频帧的音频指纹信息,得到对应的伴奏音频指纹信息序列,并将所述伴奏音频指纹信息序列确定为第二音频指纹信息。3.根据权利要求2所述的音频处理方法,其特征在于,获取所述歌曲音频帧序列中的每一歌曲音频帧的音频指纹信息,得到对应的歌曲音频指纹信息序列,包括:获取所述歌曲音频帧序列中的每一歌曲音频帧的音频指纹,并获取每一歌曲音频帧的音频指纹所对应的哈希值,将每一歌曲音频帧对应的哈希值确定为每一歌曲音频帧的音频指纹信息,得到对应的第一哈希值序列,将所述第一哈希值序列确定为对应的歌曲音频指纹信息序列;获取所述伴奏音频帧序列中的每一伴奏音频帧的音频指纹信息,得到对应的伴奏音频指纹信息序列,包括:获取所述伴奏音频帧序列中的每一伴奏音频帧的音频指纹,并获取每一伴奏音频帧的音频指纹所对应的哈希值,将每一伴奏音频帧对应的哈希值确定为每一伴奏音频帧的音频指纹信息,得到对应的第二哈希值序列,将所述第二哈希值序列确定为对应的伴奏音频指纹信息序列;对所述第一音频指纹信息和所述第二音频指纹信息进行匹配,得到音频指纹信息匹配结果,包括:对所述第一哈希值序列和所述第二哈希值序列进行匹配,得到对应的匹配结果,并将所述对应的匹配结果确定为音频指纹信息匹配结果。4.根据权利要求2或3所述的音频处理方法,其特征在于,所述将所述歌曲音频划分为多个歌曲音频帧,得到歌曲音频帧序列,包括:将所述歌曲音频进行降采样,将降采样后的歌曲音频划分为多个歌曲音频帧,得到歌曲音频帧序列;所述将所述伴奏音频划分为多个伴奏音频帧,得到伴奏音频帧序列,包括:将所述伴奏音频进行降采样,将降采样后的伴奏音频划分为多个伴奏音频帧,得到伴奏音频帧序列;其中,所述降采样后的歌曲音频和所述降采样后的伴奏音频的采样率一致。5.根据权利要求4所述的音频处理方法,其特征在于,所述歌曲音频帧序列中顺序相邻2CN111312297A权利要求书2/3页的前后两帧具有第一重叠率,并且所述伴奏音频帧序列中顺序相