一种基于GPU实现的快速音频检索方法-豆柴文库

一种基于GPU实现的快速音频检索方法.pdf

2023-06-26

10金币

378KB

11页

哲妍****彩妍

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共11页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局*CN102033927A*(12)发明专利申请(10)申请公布号CN102033927A(43)申请公布日2011.04.27(21)申请号201010589841.2(22)申请日2010.12.15(71)申请人哈尔滨工业大学地址150001黑龙江省哈尔滨市南岗区西大直街92号(72)发明人韩纪庆杜艳斌(74)专利代理机构哈尔滨市松花江专利商标事务所23109代理人岳泉清(51)Int.Cl.G06F17/30(2006.01)权利要求书2页说明书5页附图3页(54)发明名称一种基于GPU实现的快速音频检索方法(57)摘要一种基于GPU实现的快速音频检索方法。本发明涉及检索的方法。本发明解决了现有基于内容音频检索方法检索速度慢的问题。一、判断图像处理器GPU中是否有音频片段的特征信息，否进入步骤二，是进入步骤三；二、预处理；三、音频片段向量滑动匹配；四、向量滑动匹配结果是否大于设定的第一阈值的结果，否返回步骤一；是进入步骤五；五、音频片段梅尔倒谱系数特征矩阵匹配；六、梅尔倒谱系数矩阵匹配结果大于设定的第二阈值的结果，否返回步骤一，是判定为匹配成功，对匹配成功的结果进行相应的处理。本方法不仅极大的提高了音频检索速度，而且保证了检索的精确度。CN102397ACCNN110203392702033930A权利要求书1/2页1.一种基于GPU实现的快速音频检索方法，其特征在于它的步骤如下：步骤一：初始：判断图像处理器GPU中是否有音频片段的特征信息，否，则进入步骤二，进行音频流数据的预处理；是，则进入步骤三，进行音频片段的特征信息的向量滑动匹配；步骤二：预处理：中央处理器CPU将输入音频检索系统的音频流数据分割成音频片段，对各个音频片段进行特征提取，并对音频片段的特征信息进行分组，之后将每组音频片段的特征信息依次传输到图像处理器GPU的纹理存储器中；步骤三：音频片段向量滑动匹配：图像处理器GPU的纹理存储器中的向量滑动匹配模块利用音频片段的特征信息中的片段向量特征进行向量滑动匹配，记录向量滑动匹配结果；并通过图像处理器GPU将记录的向量滑动匹配结果发送到中央处理器CPU；步骤四：第一阈值判断：在中央处理器CPU中顺序遍历所述向量滑动匹配结果，判断所述向量滑动匹配结果是否大于设定的第一阈值的结果，否，则将所述向量滑动匹配结果的音频片段的特征信息传输到图像处理器GPU中；返回步骤一，是，则将所述向量滑动匹配结果的音频片段的特征信息传输到图像处理器GPU的全局存储器中，进入步骤五；步骤五：音频片段梅尔倒谱系数特征矩阵匹配：图像处理器GPU的全局存储器中的梅尔倒谱系数特征矩阵匹配模块利用音频片段的特征信息中的梅尔倒谱系数特征及其差分特征进行梅尔倒谱系数矩阵匹配，记录梅尔倒谱系数矩阵匹配结果；并通过图像处理器GPU将记录的梅尔倒谱系数矩阵匹配结果发送到中央处理器CPU；步骤六：第二阈值判断：在中央处理器CPU中顺序遍历梅尔倒谱系数矩阵匹配结果，判断所述的梅尔倒谱系数矩阵匹配结果是否大于设定的第二阈值的结果，否，则将所述梅尔倒谱系数矩阵匹配结果的音频片段的特征信息传输到图像处理器GPU中，返回步骤一；是，则判定为匹配成功，对匹配成功的结果进行相应的处理。2.根据权利要求1所述的一种基于GPU实现的快速音频检索方法，其特征在于音频片段的特征信息包括梅尔倒谱系数及其差分特征和片段向量特征，其中片段向量特征是梅尔倒谱系数及其差分特征的降维特征。3.根据权利要求1或2所述的一种基于GPU实现的快速音频检索方法，其特征在于梅尔倒谱系数特征矩阵匹配模块和向量滑动匹配模块是采用下述方法获得的：步骤A：中央处理器CPU根据音频检索系统功能及规模建立原始音频库；对所述的原始音频库内的每个音频文件进行特征提取，从而获得梅尔倒谱系数及其差分特征和片段向量特征两种特征信息，利用所述的特征信息建立参考模板库；步骤B：将所述的参考模板库传输到图像处理器GPU中，根据图像处理器GPU的显存容量的大小及参考模板库的大小选择不同的存储器：图像处理器GPU的全局存储器中存放梅尔倒谱系数特征矩阵形成梅尔倒谱系数特征矩阵匹配模块，图像处理器GPU的纹理存储器中存放片段向量特征形成向量滑动匹配模块。4.根据权利要求3所述的一种基于GPU实现的快速音频检索方法，其特征在于步骤三所述的图像处理器GPU的纹理存储器中的向量滑动匹配模块利用音频片段的特征信息中2CCNN110203392702033930A权利要求书2/2页的片段向量特征进行向量滑动匹配的过程为：步骤三1：根据输入图像处理器GPU的音频片段的个数进行线程配置，将全部线程分为线程组；步骤三2：将参考模板库中的参考模板的片段向量特征传输到对应线程组内每个线程的共享存储器中，根据线程配置为每

相关资料

一种基于GPU实现的快速音频检索方法.pdf

一种基于GPU实现的快速音频检索方法。本发明涉及检索的方法。本发明解决了现有基于内容音频检索方法检索速度慢的问题。一、判断图像处理器GPU中是否有音频片段的特征信息，否进入步骤二，是进入步骤三；二、预处理；三、音频片段向量滑动匹配；四、向量滑动匹配结果是否大于设定的第一阈值的结果，否返回步骤一；是进入步骤五；五、音频片段梅尔倒谱系数特征矩阵匹配；六、梅尔倒谱系数矩阵匹配结果大于设定的第二阈值的结果，否返回步骤一，是判定为匹配成功，对匹配成功的结果进行相应的处理。本方法不仅极大的提高了音频检索速度，而且保证

2023-06-26

378KB

基于GPU的结构光中心快速提取方法及实现.docx

基于GPU的结构光中心快速提取方法及实现论文标题：基于GPU的结构光中心快速提取方法及实现摘要：随着三维成像技术的不断发展，结构光成像作为一种非接触式的三维表面重建方法，受到了广泛关注。然而，由于结构光图像中存在着大量的噪声和干扰信息，结构光中心提取一直是一个重要且困难的问题。本文提出了一种基于图形处理器（GPU）的结构光中心快速提取方法，并通过实验证明该方法的效果显著。1.引言结构光成像技术是一种通过激光器发射结构化光并捕获光线反射或散射后形成的图像来重建三维表面形状的方法。与其他三维成像技术相比，结构

2024-11-10

11KB

一种基于音频指纹的语音检索方法及系统.pdf

本发明涉及一种基于音频指纹的语音检索方法及系统。该方法包括：提取时长为20s的原始语音的梅尔频率倒谱系数MFCC特征和线性预测倒谱系数LPCC特征；将所述MFCC特征和所述LPCC特征进行特征组合处理，确定组合后的特征矩阵；基于信息熵的特征降维方法，对所述组合后的特征矩阵进行列降维，确定列降维后的特征矩阵；基于能量的特征降维方法，对所述列降维后的特征矩阵进行行降维，确定行降维后的特征矩阵；根据所述行降维后的特征矩阵构建音频指纹数据库；利用归一化汉明距离算法，将待查询语音片段与所述音频指纹库中的音频指纹进行

2023-06-25

838KB

一种基于GPU并行加速的快速建模方法.docx

一种基于GPU并行加速的快速建模方法在当今的计算机世界中，GPU并行计算技术已经成为了一种非常重要的计算方式，尤其是在深度学习、计算机视觉和自然语言处理等领域，GPU并行计算的加速效果非常明显。随着计算机硬件的不断升级和GPU并行计算技术的不断发展，越来越多的计算机应用程序开始采用GPU并行加速技术来提高计算性能。其中，一种基于GPU并行加速的快速建模方法逐渐被广泛采用。快速建模是一个非常重要的技术，它可以在较短的时间内构建出大量的模型，以便在不同的应用场景中进行测试和比较。快速建模技术可以应用于各种不同

2024-10-29

10KB

一种基于指纹因子的鲁棒音频检索方法.docx

一种基于指纹因子的鲁棒音频检索方法标题：一种基于指纹因子的鲁棒音频检索方法摘要：音频检索是一种重要的多媒体检索技术，它可以在广泛的应用场景中帮助用户快速准确地定位所需音频。然而，由于音频信号的复杂性和多样性，音频检索仍然面临着许多挑战。本文针对这些问题，提出了一种基于指纹因子的鲁棒音频检索方法。该方法充分利用音频指纹技术的优势，并通过引入指纹因子的概念，提高了音频检索的准确性和鲁棒性。实验结果表明，该方法在音频检索任务中具有较好的性能和效果。关键词：音频检索、指纹因子、鲁棒性、准确性1.引言音频检索是一种

2024-10-23

11KB