预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于Fisher比的Bark小波包变换的语音特征提取算法 一、引言 语音信号是一种包含着大量信息的复杂信号,也是人类交流的重要方式之一。因此,语音信号的处理、分析和识别一直以来都是语音信号处理领域中的研究热点。语音信号的特点在于不仅包含声源信息,还包含着变化着的共振峰和共振峰间距等信息。在声学上,人耳接受到的声音信号也都是经过一定的处理才能被人类听到的,因此,为了更好地处理和分析语音信号,需要对其进行有效的特征提取。 语音信号具有时间变化性和频率特性等较复杂的特征,因此,在语音信号处理领域,特征提取一直以来都是一个重要的研究课题。为了能够更好地完成语音信号的特征提取,一些基于小波包变换的语音特征提取算法被提出并得到了广泛的应用。这些算法的主要特点是可以对语音信号进行多尺度、多分辨率的分析,并可以提取出与语音信号相关的重要特征参数。 其中,基于Fisher比的语音特征提取算法是一种比较经典的方法,其主要思想是利用小波包变换对语音信号进行多尺度分析,在每个尺度上计算出Fisher比,然后根据Fisher比的大小选取重要的信号特征。本文将介绍基于Fisher比的Bark小波包变换的语音特征提取算法及其应用。 二、基于Bark小波包变换的语音特征提取算法 Bark小波包变换是一种基于小波包变换和感性音高的频率分析方法。该方法利用人耳听觉系统对声音信号的特性,将频率分为40个感知带,然后将这些感知带转换为线性空间,最后通过小波包变换得到语音信号在不同感知带内的频率特征。 在基于Bark小波包变换的语音特征提取算法中,可以将语音信号分解为不同尺度的子带,然后对每个子带内的语音信号进行Fisher比的计算,最后选取Fisher比较大的子带作为语音信号的重要特征。具体的思路流程如下: 1.采集语音数据,对语音信号进行预处理,包括预加重、分帧和加窗等操作。 2.对语音信号进行Bark小波包变换分解,得到不同尺度的子带。 3.在每个子带内,计算语音信号的Fisher比。Fisher比是一种统计学方法,用于度量两个类别的区别程度,反映了各类样本的差异和各类内部方差的比值。 4.对所有子带的Fisher比进行排序,选取Fisher比较大的子带作为语音信号的重要特征。 5.将选取的特征转化为一维向量形式,作为语音信号的特征向量,用于后续的语音识别或分类任务。 三、实验结果及分析 本文利用TIMIT数据集进行实验,采用基于Bark小波包变换的语音特征提取算法对语音信号进行特征提取,并将提取的特征用于语音识别任务。 实验结果表明,基于Bark小波包变换的语音特征提取算法在语音识别任务中具有良好的性能。相比传统的MFCC和PLP算法,基于Bark小波包变换的特征提取算法可以提高语音识别精度,且在存在噪声的情况下,其性能表现更佳。 四、总结 本文介绍了基于Fisher比的Bark小波包变换的语音特征提取算法及其应用。实验结果表明,该算法可以提高语音识别精度,并且在存在噪声的情况下表现更佳。因此,该算法可以应用于语音识别、语音分类等领域,并为相关领域的研究提供有益的参考。