预览加载中,请您耐心等待几秒...
1/4
2/4
3/4
4/4

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于组合去噪方法的鲁棒性语音识别 摘要 随着语音识别技术的不断发展,信号的质量问题已成为影响语音识别性能的主要因素之一。本论文提出了一种基于组合去噪方法的鲁棒性语音识别技术。该方法通过对语音信号进行预处理,包括去噪、语音分段和特征提取,然后采用多种分类方法组合的方式来提高识别准确率。实验结果表明,该方法在噪声干扰下,能够大幅提高识别率,具有很好的应用前景。 关键词:鲁棒性语音识别、组合去噪、特征提取、分类方法、识别率 1.引言 语音识别技术的发展已经使得从事实时语音识别的应用得到广泛的应用和推广。然而,在实际应用中,由于环境噪声、说话人的口齿不清、声音抖动等因素的影响,语音信号的质量问题成为影响语音识别性能的主要因素之一。因此,提高鲁棒性语音识别的性能,具有重要的现实意义。 在过去的几十年中,已经涌现出了很多的鲁棒性语音识别技术,例如说话人特定鲁棒性识别、噪声适应性算法、特定语音领域识别等。但是,这些方法都存有一些问题,比如对说话人特定性的依赖性太大、对噪声干扰的抗性不够、处理速度慢等。因此,急需一种能够克服这些问题的鲁棒性语音识别技术。 本文主要介绍一种基于组合去噪方法的鲁棒性语音识别技术。该方法通过对语音信号进行预处理,然后采用多种分类方法组合的方式进行识别。实验证明,该方法能够大幅提高识别率,在噪声干扰下,具有很好的应用前景。 2.相关工作 在鲁棒性语音识别的研究领域中,去噪算法是一种非常重要的方法。其中,基于频域和时域的方法最为常见。频域方法是通过在频域中将语音信号分为语音区域和噪声区域来处理,而时域方法是在时域中将语音信号分为很多对数级别的带通滤波器,以减少噪声的影响。另外,基于小波变换的方法也被应用于语音识别中。 除去噪技术外,特征提取也是鲁棒性语音识别中的一个重要环节。传统的特征提取算法包括MFCC(Mel-FrequencyCepstralCoefficients)、LPCC(LinearPredictiveCepstralCoefficients)、LSP(LineSpectrumPair)等。近年来,一些新型特征提取算法也被提出,例如声流提取、认知特征提取等。 分类方法是鲁棒性语音识别中的最后一个环节。常见的分类方法包括KNN算法、支持向量机算法、神经网络等。 3.方法设计 在本文中,我们提出了一种基于组合去噪方法的鲁棒性语音识别技术。该方法包括以下三个步骤: 3.1语音预处理 在语音预处理阶段,我们主要对语音信号进行去噪处理、语音分段和特征提取。 3.1.1去噪处理 在本文中,我们采用的是时域去噪方法。其基本思想是通过将语音信号分段,然后基于局部信号特性进行去噪。这里我们采用了MMSE-STSA去噪方法,该方法是目前应用最广泛的一种时域去噪方法。 3.1.2语音分段 在语音分段阶段,我们主要采用了VAD(VoiceActivityDetection)技术,通过对语音检测,将语音信号分为若干个语音段,然后对每个语音段进行特征提取。 3.1.3特征提取 在特征提取阶段,我们采用了声流提取法来提取语音的特征。声流特征提取方法是一种非常新型的特征提取方法,它将语音信号分为多个带通滤波器,然后提取不同频段的特征。特征提取后,我们将得到一个N维的特征向量,用于后续的分类。 3.2分类方法 在分类方法中,我们采用的是多种分类方法组合的方案,以提高识别准确率。 3.2.1单分类器方法 在单分类器方法中,我们主要采用了KNN和支持向量机算法进行分类。这两种算法都是常用的分类方法,具有较高的识别准确率。 其中,KNN算法基于样本之间的欧式距离进行分类。当一个新的样本被输入到该算法中时,会在训练集中查找与之最近的k个样本,并以这k个样本中最多的类别作为预测的类别。 支持向量机算法是一种基于判别学习的方法。其基本思想是将样本映射到高维空间中,使得样本在高维空间中更容易分开。该算法具有很好的鲁棒性和普适性。 3.2.2组合分类器方法 在组合分类器方法中,我们主要采用了多数投票法和加权投票法。这两种方法都是基于多个分类器的方法,以提高识别准确率。 多数投票法是一种非常简单的组合方法,其基本思想是在多个分类器中,选择出预测最多的类别作为预测结果。这里我们选择了KNN算法和支持向量机算法两个分类器,并对它们的结果进行投票,然后以投票最多的类别作为预测结果。 加权投票法是在多数投票法的基础上,增加了分类器的权重。我们选择了两个分类器,并对它们的结果进行加权投票。这里的权重是通过实验得到的。 4.实验结果 在本实验中,我们的语音库是来自TIMIT数据库的英文单词语音,其中训练集包括4620个样本,测试集包括1680个样本。我们采用的是加性高斯白噪声进行干扰。实验表明,在0~20dB的噪声下,鲁棒性语音识别的效果比传统方法有很大的提高。具体结