预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局*CN102033927A*(12)发明专利申请(10)申请公布号CN102033927A(43)申请公布日2011.04.27(21)申请号201010589841.2(22)申请日2010.12.15(71)申请人哈尔滨工业大学地址150001黑龙江省哈尔滨市南岗区西大直街92号(72)发明人韩纪庆杜艳斌(74)专利代理机构哈尔滨市松花江专利商标事务所23109代理人岳泉清(51)Int.Cl.G06F17/30(2006.01)权利要求书2页说明书5页附图3页(54)发明名称一种基于GPU实现的快速音频检索方法(57)摘要一种基于GPU实现的快速音频检索方法。本发明涉及检索的方法。本发明解决了现有基于内容音频检索方法检索速度慢的问题。一、判断图像处理器GPU中是否有音频片段的特征信息,否进入步骤二,是进入步骤三;二、预处理;三、音频片段向量滑动匹配;四、向量滑动匹配结果是否大于设定的第一阈值的结果,否返回步骤一;是进入步骤五;五、音频片段梅尔倒谱系数特征矩阵匹配;六、梅尔倒谱系数矩阵匹配结果大于设定的第二阈值的结果,否返回步骤一,是判定为匹配成功,对匹配成功的结果进行相应的处理。本方法不仅极大的提高了音频检索速度,而且保证了检索的精确度。CN102397ACCNN110203392702033930A权利要求书1/2页1.一种基于GPU实现的快速音频检索方法,其特征在于它的步骤如下:步骤一:初始:判断图像处理器GPU中是否有音频片段的特征信息,否,则进入步骤二,进行音频流数据的预处理;是,则进入步骤三,进行音频片段的特征信息的向量滑动匹配;步骤二:预处理:中央处理器CPU将输入音频检索系统的音频流数据分割成音频片段,对各个音频片段进行特征提取,并对音频片段的特征信息进行分组,之后将每组音频片段的特征信息依次传输到图像处理器GPU的纹理存储器中;步骤三:音频片段向量滑动匹配:图像处理器GPU的纹理存储器中的向量滑动匹配模块利用音频片段的特征信息中的片段向量特征进行向量滑动匹配,记录向量滑动匹配结果;并通过图像处理器GPU将记录的向量滑动匹配结果发送到中央处理器CPU;步骤四:第一阈值判断:在中央处理器CPU中顺序遍历所述向量滑动匹配结果,判断所述向量滑动匹配结果是否大于设定的第一阈值的结果,否,则将所述向量滑动匹配结果的音频片段的特征信息传输到图像处理器GPU中;返回步骤一,是,则将所述向量滑动匹配结果的音频片段的特征信息传输到图像处理器GPU的全局存储器中,进入步骤五;步骤五:音频片段梅尔倒谱系数特征矩阵匹配:图像处理器GPU的全局存储器中的梅尔倒谱系数特征矩阵匹配模块利用音频片段的特征信息中的梅尔倒谱系数特征及其差分特征进行梅尔倒谱系数矩阵匹配,记录梅尔倒谱系数矩阵匹配结果;并通过图像处理器GPU将记录的梅尔倒谱系数矩阵匹配结果发送到中央处理器CPU;步骤六:第二阈值判断:在中央处理器CPU中顺序遍历梅尔倒谱系数矩阵匹配结果,判断所述的梅尔倒谱系数矩阵匹配结果是否大于设定的第二阈值的结果,否,则将所述梅尔倒谱系数矩阵匹配结果的音频片段的特征信息传输到图像处理器GPU中,返回步骤一;是,则判定为匹配成功,对匹配成功的结果进行相应的处理。2.根据权利要求1所述的一种基于GPU实现的快速音频检索方法,其特征在于音频片段的特征信息包括梅尔倒谱系数及其差分特征和片段向量特征,其中片段向量特征是梅尔倒谱系数及其差分特征的降维特征。3.根据权利要求1或2所述的一种基于GPU实现的快速音频检索方法,其特征在于梅尔倒谱系数特征矩阵匹配模块和向量滑动匹配模块是采用下述方法获得的:步骤A:中央处理器CPU根据音频检索系统功能及规模建立原始音频库;对所述的原始音频库内的每个音频文件进行特征提取,从而获得梅尔倒谱系数及其差分特征和片段向量特征两种特征信息,利用所述的特征信息建立参考模板库;步骤B:将所述的参考模板库传输到图像处理器GPU中,根据图像处理器GPU的显存容量的大小及参考模板库的大小选择不同的存储器:图像处理器GPU的全局存储器中存放梅尔倒谱系数特征矩阵形成梅尔倒谱系数特征矩阵匹配模块,图像处理器GPU的纹理存储器中存放片段向量特征形成向量滑动匹配模块。4.根据权利要求3所述的一种基于GPU实现的快速音频检索方法,其特征在于步骤三所述的图像处理器GPU的纹理存储器中的向量滑动匹配模块利用音频片段的特征信息中2CCNN110203392702033930A权利要求书2/2页的片段向量特征进行向量滑动匹配的过程为:步骤三1:根据输入图像处理器GPU的音频片段的个数进行线程配置,将全部线程分为线程组;步骤三2:将参考模板库中的参考模板的片段向量特征传输到对应线程组内每个线程的共享存储器中,根据线程配置为每