一种基于音频指纹的听歌识曲方法、系统及音频设备-豆柴文库

一种基于音频指纹的听歌识曲方法、系统及音频设备.pdf

2023-12-03

10金币

756KB

15页

灵慧****89

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共15页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111161758A(43)申请公布日2020.05.15(21)申请号201911229948.3(22)申请日2019.12.04(71)申请人厦门快商通科技股份有限公司地址361009福建省厦门市软件园三期诚毅北大街63号1301单元(72)发明人曾志先肖龙源李稀敏蔡振华刘晓葳(74)专利代理机构厦门仕诚联合知识产权代理事务所(普通合伙)35227代理人乐珠秀(51)Int.Cl.G10L25/51(2013.01)G10L25/54(2013.01)G06F16/683(2019.01)G06F16/61(2019.01)权利要求书2页说明书8页附图4页(54)发明名称一种基于音频指纹的听歌识曲方法、系统及音频设备(57)摘要本发明公开了一种基于音频指纹的听歌识曲方法、系统及音频设备，其收集歌曲音频作为模板音频，并获取所述模板音频对应的频谱图，从所述频谱图中提取峰值点作为所述模板音频对应的模板音频指纹，根据所述模板音频和所述模板音频指纹进行构建歌曲音频的模板音频指纹数据库；获取当前音乐的录制音频，并获取所述录制音频对应的频谱图，从所述频谱图中提取峰值点作为所述录制音频对应的录制音频指纹；将所述录制音频指纹与所述模板音频指纹数据库中的模板音频指纹进行匹配；若匹配度达到设定的阈值，则输出所述录制音频对应匹配的歌曲音频，从而能够自动识别歌曲，算法高效，识别准确，具有较高的便携性。CN111161758ACN111161758A权利要求书1/2页1.一种基于音频指纹的听歌识曲方法，其特征在于，包括以下步骤：收集歌曲音频作为模板音频，并获取所述模板音频对应的频谱图，从所述频谱图中提取峰值点作为所述模板音频对应的模板音频指纹，根据所述模板音频和所述模板音频指纹进行构建歌曲音频的模板音频指纹数据库；获取当前音乐的录制音频，并获取所述录制音频对应的频谱图，从所述频谱图中提取峰值点作为所述录制音频对应的录制音频指纹；将所述录制音频指纹与所述模板音频指纹数据库中的模板音频指纹进行匹配；若匹配度达到设定的阈值，则输出所述录制音频对应匹配的歌曲音频。2.根据权利要求1所述的基于音频指纹的听歌识曲方法，其特征在于：将所述录制音频指纹与所述模板音频指纹数据库中的模板音频指纹进行匹配，包括：对所述录制音频指纹对应的频谱图中的峰值点和所述模板音频指纹对应的频谱图中的峰值点按照时间维度的顺序进行音频指纹的匹配；或者，对所述录制音频指纹对应的频谱图中的峰值点和/或所述模板音频指纹对应的频谱图中的峰值点进行分组，得到峰值点组合，并计算每个峰值点组合对应的哈希值，根据所述哈希值进行音频指纹的匹配。3.根据权利要求2所述的基于音频指纹的听歌识曲方法，其特征在于：所述峰值点组合包括M个峰值点和一个锚点，所述锚点的频率小于或等于所述峰值点的频率，所述锚点用于获取所述峰值点组合中的每个峰值点相对所述锚点的时间差；根据所述峰值点的频率值、所述锚点的频率值、所述峰值点与所述锚点之间的时间差进行创建所述峰值点对应的三维数组；计算所述三维数组的哈希值，作为所述峰值点的哈希值。4.根据权利要求3所述的基于音频指纹的听歌识曲方法，其特征在于：根据所述哈希值进行音频指纹的匹配，是通过对所述峰值点组合中的每个峰值点的哈希值进行匹配实现音频指纹的匹配；或者，是根据每个峰值点的哈希值计算所述峰值点组合的总和哈希值，通过对所述峰值点组合的总和哈希值进行匹配实现音频指纹的匹配；或者，是根据每个峰值点的哈希值计算最大哈希值，将该最大哈希值作为所述峰值点组合的代表哈希值，通过对所述峰值点组合的代表哈希值进行匹配实现音频指纹的匹配。5.根据权利要求1所述的基于音频指纹的听歌识曲方法，其特征在于：将所述录制音频指纹与所述模板音频指纹数据库中的模板音频指纹进行匹配，进一步包括以下匹配步骤：从所述模板音频指纹数据库中提取任一模板音频指纹，对所述当前音乐的录制音频指纹和所述模板音频指纹数据库中的模板音频指纹分别建立对应的音频指纹哈希表；根据所述音频指纹哈希表确定所述任一模板音频指纹与所述当前音乐的录制音频指纹的相似度；若所述相似度小于设定相似度阈值，提取所述任一模板音频指纹的下一模板音频指纹，并判断该下一模板音频指纹与所述当前音乐的录制音频指纹的相似度，如此循环；判断是否存在与所述当前音乐的录制音频指纹的相似度大于设定相似度阈值的模板音频指纹，若存在，则输出所述录制音频对应匹配的歌曲音频。6.根据权利要求1所述的基于音频指纹的听歌识曲方法，其特征在于：将所述录制音频指纹与所述模板音频指纹数据库中的模板音频指纹进行匹配，进一步包括以下匹配步骤：对所述当前音乐的录制音频指纹和所述模板音频指纹数据库中的模板音频指纹分别2CN1111

相关资料

一种基于音频指纹的听歌识曲方法、系统及音频设备.pdf

本发明公开了一种基于音频指纹的听歌识曲方法、系统及音频设备，其收集歌曲音频作为模板音频，并获取所述模板音频对应的频谱图，从所述频谱图中提取峰值点作为所述模板音频对应的模板音频指纹，根据所述模板音频和所述模板音频指纹进行构建歌曲音频的模板音频指纹数据库；获取当前音乐的录制音频，并获取所述录制音频对应的频谱图，从所述频谱图中提取峰值点作为所述录制音频对应的录制音频指纹；将所述录制音频指纹与所述模板音频指纹数据库中的模板音频指纹进行匹配；若匹配度达到设定的阈值，则输出所述录制音频对应匹配的歌曲音频，从而能够自动

2023-12-03

756KB

一种基于音频指纹的语音检索方法及系统.pdf

本发明涉及一种基于音频指纹的语音检索方法及系统。该方法包括：提取时长为20s的原始语音的梅尔频率倒谱系数MFCC特征和线性预测倒谱系数LPCC特征；将所述MFCC特征和所述LPCC特征进行特征组合处理，确定组合后的特征矩阵；基于信息熵的特征降维方法，对所述组合后的特征矩阵进行列降维，确定列降维后的特征矩阵；基于能量的特征降维方法，对所述列降维后的特征矩阵进行行降维，确定行降维后的特征矩阵；根据所述行降维后的特征矩阵构建音频指纹数据库；利用归一化汉明距离算法，将待查询语音片段与所述音频指纹库中的音频指纹进行

2023-06-25

838KB

《听歌识曲》.ppt

《听歌识曲》第一题答案：第二题答案：第三题答案：第四题答案：第五题答案：第六题答案：第七题答案：第八题答案：第九题答案：第十题答案：第十一题答案：第十二题答案：第十二题答案：第十三题答案：第十四题答案：第十五题答案：第十五题答案：第十六题答案：第十七题答案：第十八题答案：第十九题答案：第二十题答案：第二十一题答案：第二十二题答案：第二十三题答案：第二十四题答案：第二十五题答案：第二十六题答案：第二十七题答案：第二十八题答案：第二十九题答案：第三十题答案：第三十一题答案：第三十二题答案：第三十三题答案：第三

2024-10-27

3.5MB

一种音频设备测试系统.pdf

本实用新型一种音频设备测试系统,包括电脑(1)、手机(2)、控制器(3)和拾音器(4);电脑(1)与手机(2)连接,手机(2)与被测音频设备(5)连接,电脑(1)控制手机(2)播放测试音频信号,并由被测音频设备(5)播放;电脑(1)与控制器(3)连接,电脑(1)通过控制器(3)控制被测音频设备(5)按键;拾音器(4)与电脑(1)连接,拾音器(4)设置于被测音频设备(5)放置位置的周围,拾音器(4)获取被测音频设备(5)播放的声音信号,电脑(1)接收所述拾音器(4)获取的声音信号并判断所述被测音频设备(5)

2023-06-06

一种音频设备测试系统.pdf

2023-05-18

271KB