预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

研究语音辨认技术必知的声学特性HYPERLINK""\t"_blank"祁慧慧|创建时间:2023年07月27日16:13|浏览:160|评论:0标签:HYPERLINK"javascript:void(0)"HYPERLINK"javascript:void(0)"【导读】语音声学特性的提取与选择是语音辨认的一个重要环节。声学特性的提取既是一个信息大幅度压缩的过程,也是一个信号解卷过程,目的是使模式划分器能更好地划分。本文具体介绍了语音辨认技术研究者必知的声学特性。语音辨认技术中,声学特性参数提取的目的是对语音信号进行分析解决,去掉与语音辨认无关的冗余信息,获得影响语音辨认的重要信息,同时对语音信号进行压缩。在实际应用中,语音信号的压缩率介于10-100之间。语音信号包含了大量各种不同的信息,提取哪些信息,用哪种方式提取,需要综合考虑各方面的因素,如成本、性能、响应时间、计算量等。因此,掌握语音辨认常用声学特性是每一个语音辨认技术研究者必备的专业技能之一。线性预测系数LPC线性预测分析从人的发声机理入手,通过对声道的短管级联模型的研究,认为系统的传递函数符合全极点数字滤波器的形式,从而n时刻的信号可以用前若干时刻的信号的线性组合来估计。通过使实际语音的采样值和线性预测采样值之间达成均方差最小LMS,即可得到线性预测系数LPC。对LPC的计算方法有自相关法(德宾Durbin法)、协方差法、格型法等等。计算上的快速有效保证了这一声学特性的广泛使用。与LPC这种预测参数模型类似的声学特性尚有线谱对LSP、反射系数等等。倒谱系数CEP运用同态解决方法,对语音信号求离散傅立叶变换DFT后取对数,再求反变换iDFT就可得到倒谱系数。对LPC倒谱(LPCCEP),在获得滤波器的线性预测系数后,可以用一个递推公式计算得出。实验表白,使用倒谱可以提高特性参数的稳定性。Mel倒谱系数MFCC和感知线性预测PLP不同于LPC等通过对人的发声机理的研究而得到的声学特性,Mel倒谱系数MFCC和感知线性预测PLP是受人的听觉系统研究成果推动而导出的声学特性。对人的听觉机理的研究发现,当两个频率相近的音调同时发出时,人只能听到一个音调。临界带宽指的就是这样一种令人的主观感觉发生突变的带宽边界,当两个音调的频率差小于临界带宽时,人就会把两个音调听成一个,这称之为屏蔽效应。Mel刻度是对这一临界带宽的度量方法之一。MFCC的计算一方面用FFT将时域信号转化成频域,之后对其对数能量谱用依照Mel刻度分布的三角滤波器组进行卷积,最后对各个滤波器的输出构成的向量进行离散余弦变换DCT,取前N个系数。PLP仍用德宾法去计算LPC参数,但在计算自相关参数时用的也是对听觉激励的对数能量谱进行DCT的方法。非特定人语音特性VS特定人语音特性非特定人语音辨认系统一般侧重提取反映语义的特性参数,尽量去除说话人的个人信息;而特定人语音辨认系统则希望在提取反映语义的特性参数的同时,尽量也包含说话人的个人信息。文章为作者独立观点,不代表阿里巴巴以商会友立场。转载此文章须经作者批准,并附上出处及文章链接。语音辨认系统技术原理剖析HYPERLINK""\t"_blank"祁慧慧|创建时间:2023年07月19日13:35|浏览:235|评论:0标签:HYPERLINK"javascript:void(0)"HYPERLINK"javascript:void(0)"【导读】根据语音辨认实际应用中的不同,语音辨认系统可以分为:特定人与非特定人的辨认、独立词与连续词的辨认、小词汇量与大词汇量以及无限词汇量的辨认。但无论哪种语音辨认系统,其基本原理和解决方法大体相同。语音辨认原理语音信号输入之后,预解决和数字化是进行语音辨认的前提条件。其中,预解决重要是进行预滤波,保存正常人的300~3400Hz的语音信号;数字化是要进行A/D转换及抗混叠等解决;特性提取是进行语音信号训练和辨认必不可少的环节。可以体现语音信号特性的参数涉及:(1)基于LPC的倒谱参数;(2)Mel系数的倒谱参数;(3)采用前沿数字信号解决技术的特性分析手段,如小波分析、时/频域分析、人工神经网络等。本文采用基于LPC的倒谱参数表达方法,提取出的特性值存入参考模式库中,用来匹配待辨认语音信号的特性值。匹配计算是进行语音辨认的核心部分,由待辨认人的语音通过特性提取后,与系统训练时产生的模板进行匹配,在说话人辨认中,取与待辨认语音相似度最大的模型所相应的语音作为辨认结果,这就是语音辨认的整个过程。语音辨认技术从应用类分为特定人语音辨认和非特定人语音辨认。特定人语音辨认技术是针对指定人的语音辨认,其别人的话玩具不辨认,应用模式是使用前需要指定人的语音训练过程,一般按照玩具提醒训练2遍语音词条,然