预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110377782A(43)申请公布日2019.10.25(21)申请号201910631515.4(22)申请日2019.07.12(71)申请人腾讯音乐娱乐科技(深圳)有限公司地址518000广东省深圳市前海深港合作区前湾一路1号A栋201室(72)发明人孔令城(74)专利代理机构深圳翼盛智成知识产权事务所(普通合伙)44300代理人黄威(51)Int.Cl.G06F16/63(2019.01)G06F16/683(2019.01)权利要求书2页说明书13页附图4页(54)发明名称音频检索方法、装置和存储介质(57)摘要本申请实施例公开了一种音频检索方法、装置和存储介质;本申请实施例可以获取待检索音频;对待检索音频进行声谱分析,得到待检索音频对应的整体声谱;对整体声谱进行音频指纹构造,得到待检索音频的音频指纹;根据待检索音频的音频指纹进行音频检索,得到检索结果;当检索结果未满足检索停止条件时,则对待检索音频的音频指纹进行更新,并返回执行根据待检索音频的音频指纹进行音频检索的步骤;当检索结果满足检索停止条件时,则停止检索,并输出检索结果。在本申请中,可以不断地更新音频指纹并根据该音频指纹进行音频检索,使得变调和/或变速后的待检索音频也可以检索成功,由此提升了音频检索的准确率。CN110377782ACN110377782A权利要求书1/2页1.一种音频检索方法,其特征在于,包括:获取待检索音频;对所述待检索音频进行声谱分析,得到所述待检索音频对应的整体声谱;对所述整体声谱进行音频指纹构造,得到所述待检索音频的音频指纹;根据所述待检索音频的音频指纹进行音频检索,得到检索结果;当检索结果未满足检索停止条件时,则对所述待检索音频的音频指纹进行更新,并返回执行根据所述待检索音频的音频指纹进行音频检索的步骤;当检索结果满足检索停止条件时,则停止检索,并输出检索结果。2.如权利要求1所述的音频检索方法,其特征在于,对所述整体声谱进行音频指纹构造,得到所述待检索音频的音频指纹,包括:确定所述整体声谱上的关键点;根据所述关键点进行音频指纹构造,得到所述待检索音频的音频指纹。3.如权利要求2所述的音频检索方法,其特征在于,根据所述关键点进行音频指纹构造,得到所述待检索音频的音频指纹,包括:确定所述关键点对应的目标区域;确定所述目标区域中除所述关键点之外的其它关键点;基于所述关键点和所述其它关键点进行哈希计算,得到所述待检索音频的音频指纹。4.如权利要求1所述的音频检索方法,其特征在于,对所述待检索音频的音频指纹进行更新,包括:确定所述整体声谱上的关键点;对所述整体声谱上的关键点进行位置调整,得到调整后关键点;根据所述调整后关键点进行音频指纹构造,以更新所述待检索音频的音频指纹。5.如权利要求1所述的音频检索方法,其特征在于,根据所述待检索音频的音频指纹进行音频检索,得到检索结果,包括:获取数据库,其中,所述数据库中包括对象音频和所述对象音频的音频指纹;将所述数据库中对象音频的音频指纹与待检索音频的音频指纹进行相似度计算,得到所述待检索音频与对象音频的相似度;根据所述待检索音频与对象音频的相似度确定检索结果。6.如权利要求1~5任一项所述的音频检索方法,其特征在于,所述整体声谱包括时域声谱;对所述待检索音频进行声谱分析,得到所述待检索音频对应的整体声谱,包括:对所述待检索音频进行时域分析,得到所述待检索音频对应的时域声谱。7.如权利要求1~5任一项所述的音频检索方法,其特征在于,所述整体声谱包括频域声谱,对所述待检索音频进行声谱分析,得到所述待检索音频对应的整体声谱,包括:对所述待检索音频进行时域分析,得到所述待检索音频对应的时域声谱;对所述待检索音频的时域声谱进行时频转换,得到所述待检索音频对应的频域声谱。8.一种音频检索装置,其特征在于,包括:获取模块,用于获取待检索音频;分析模块,用于对所述待检索音频进行声谱分析,得到所述待检索音频对应的整体声谱;2CN110377782A权利要求书2/2页构造模块,用于对所述整体声谱进行音频指纹构造,得到所述待检索音频的音频指纹;检索模块,用于根据所述待检索音频的音频指纹进行音频检索,得到检索结果;更新模块,用于当检索结果未满足检索停止条件时,则对所述待检索音频的音频指纹进行更新,并触发所述检索模块根据所述待检索音频的音频指纹进行音频检索的步骤;输出模块,用于当检索结果满足检索停止条件时,则停止检索,并输出检索结果。9.如权利要求8所述的音频检索装置,其特征在于,所述构造模块,包括:关键点子模块,用于确定所述整体声谱上的关键点;构造子模块,用于根据所述关键点进行音频指纹构造,得到所述待检索音频的音频指纹。10.一种存储介质,其