一种基于音频指纹的语音检索方法及系统.pdf
书生****ma
亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种基于音频指纹的语音检索方法及系统.pdf
本发明涉及一种基于音频指纹的语音检索方法及系统。该方法包括:提取时长为20s的原始语音的梅尔频率倒谱系数MFCC特征和线性预测倒谱系数LPCC特征;将所述MFCC特征和所述LPCC特征进行特征组合处理,确定组合后的特征矩阵;基于信息熵的特征降维方法,对所述组合后的特征矩阵进行列降维,确定列降维后的特征矩阵;基于能量的特征降维方法,对所述列降维后的特征矩阵进行行降维,确定行降维后的特征矩阵;根据所述行降维后的特征矩阵构建音频指纹数据库;利用归一化汉明距离算法,将待查询语音片段与所述音频指纹库中的音频指纹进行
基于音频指纹特征的音乐检索系统.pdf
本发明属于信息检索技术领域,具体为一种基于音频指纹特征的音乐检索系统。该系统由预处理模块、特征提取模块、倒排索引模块和精匹配模块四部分组成。预处理模块主要完成音频信号的转换、重采样、滤波;特征提取模块是对音频文件的表示,采用音频指纹特征,通过两次基于动态阈值的筛选来选取频谱中最为稳定的点作为特征点,用一个点对表示一个特征;倒排索引模块是将特征作为关键词,由歌曲库的特征建立倒排索引,根据相同关键词多少返回索引结果;精匹配模块是结合音频特征间的时序关系,采用改进的编辑距离作为两个特征序列的相似度,以此优化索引
一种基于指纹因子的鲁棒音频检索方法.docx
一种基于指纹因子的鲁棒音频检索方法标题:一种基于指纹因子的鲁棒音频检索方法摘要:音频检索是一种重要的多媒体检索技术,它可以在广泛的应用场景中帮助用户快速准确地定位所需音频。然而,由于音频信号的复杂性和多样性,音频检索仍然面临着许多挑战。本文针对这些问题,提出了一种基于指纹因子的鲁棒音频检索方法。该方法充分利用音频指纹技术的优势,并通过引入指纹因子的概念,提高了音频检索的准确性和鲁棒性。实验结果表明,该方法在音频检索任务中具有较好的性能和效果。关键词:音频检索、指纹因子、鲁棒性、准确性1.引言音频检索是一种
基于压缩感知和音频指纹的固定音频检索方法.docx
基于压缩感知和音频指纹的固定音频检索方法基于压缩感知和音频指纹的固定音频检索方法摘要随着数字化媒体的快速发展,音频数据的规模不断增加,使得音频检索成为一个重要的研究领域。本论文提出了一种基于压缩感知和音频指纹的固定音频检索方法。首先,通过压缩感知原理对音频信号进行高效压缩并提取压缩感知测量系数。然后,基于音频指纹技术生成音频指纹,将其与数据库中的音频指纹进行比对匹配。实验结果表明,该方法在固定音频检索中具有较高的检索精度和较快的检索速度,适用于大规模音频数据库的检索。关键词:压缩感知、音频指纹、固定音频、
一种基于音频指纹的听歌识曲方法、系统及音频设备.pdf
本发明公开了一种基于音频指纹的听歌识曲方法、系统及音频设备,其收集歌曲音频作为模板音频,并获取所述模板音频对应的频谱图,从所述频谱图中提取峰值点作为所述模板音频对应的模板音频指纹,根据所述模板音频和所述模板音频指纹进行构建歌曲音频的模板音频指纹数据库;获取当前音乐的录制音频,并获取所述录制音频对应的频谱图,从所述频谱图中提取峰值点作为所述录制音频对应的录制音频指纹;将所述录制音频指纹与所述模板音频指纹数据库中的模板音频指纹进行匹配;若匹配度达到设定的阈值,则输出所述录制音频对应匹配的歌曲音频,从而能够自动