预览加载中,请您耐心等待几秒...
1/5
2/5
3/5
4/5
5/5

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

语音端点检测方法研究摘要:文章在研究语音识别系统中端点检测基本算法的基础上分别对利用双门限的端点检测方法、利用小波变换的端点检测方法、利用倒谱相关理论的端点检测方法原理进行了阐述和说明并对几种端点检测方法的特点进行了分析。关键词:端点检测;双门限;小波变换;倒谱1概述就一般情况下来讲在语音通信过程当中大多采用有线电话网的方式来进行但是由于某些地区环境及场合需要等因素则需要通过无线电台来作为通信方式。与此同时在其实际应用过程中整个通话过程由语音控制来实现。具体来讲有线方说话时本地无线电台则处于发射状态相对应来讲远端无线电台为接收状态相反来讲当有线方沉默的时候无线电台工作状态发转。其中语音端点检测方法和技术是关键基于从某段语音信号当中来准确判断语音位置(起始点与终止点)从而有效地区分是否为语音信号这样的目的。该技术对于减少数据的采集量、降低或者排除噪声段的干扰以及提高系统识别性能等方面具有关键作用。2利用双门限进行语音端点检测首先确定短时能量和短时过零率符合端点起点判定条件的帧接着再根据短时过零率和短时能量符合端点终点判定条件的帧。除此之外对于一些突发性噪声检测比如由于门窗开关所引起的噪声相对应来讲我们可以通过设置最短时间门限来进行判断。具体来讲当处于静音这一语音信号端点检测段时如数值比低门限还低与此同时最短时间门限大于计时长度那么我们基本上可以确定这是一段噪音。双门限的检测算法结合了短时能量和短时过零率的优点在得到的端点检测结果中其精确度和浊音检测都能得到很好的保证。现在有很多的端点检测算法都是根据双门限的算法进行不同的改进能使其各有优劣从而适应于不同的情况和环境。3利用小波变换进行语音端点检测小波变换属于时频分析的一种具体来说是空间(时间)和频率的局部变换因而能有效的从信号中提取信息。小波变换能将信号在时域中表现不了的特征在频域中表现出来。因此利用小波变换的这一个特性根据有效的说话人的声音数据和背景噪声数据的频谱存在明显差异的特征来进行端点检测。一般有效的说话人的声音数据的频谱分布范围很大而且频率的值也很大。而背景噪声的频谱变化不大而且值也较小。因此先将语音数据分帧将分帧后的数据进行一次小波变换再对小波变换后的数据计算方差如果计算的结果大于一定的阈值那么这帧即被记为起始帧若在起始帧存在的情况下计算的结果小于阈值则被记为结束帧。4利用倒谱系数和倒谱距离进行语音端点检测(1)预处理:对8kHz采样信号进行预加重处理然后分帧加窗帧长取16ms(128个采样点)帧移4ms对每一帧信号加128点的矩形窗。(2)估计噪声倒谱系数和倒谱距离:阶数p取12首先假定抽样信号起始10帧是背景噪声利用这10帧的前5帧倒谱系数的统计平均值作为背景噪声倒谱系数的估计值用向量表示。同时计算这10帧的后5帧倒谱距离平均值作为背景噪声倒谱距离的估计值其中表示当前帧的倒谱系数为对应的倒谱系数。(3)逐帧计算值:逐帧计算倒谱系数然后由每帧信号的倒谱系数和噪声倒谱系数的估计值计算倒谱距离。(4)确定判决门限:采用类似于短时能量检测法所使用的动态门限判决准则。5端点检测方法的对比分析结论在对三种算法的算法特性、适用情况、检测精度和检测速度做一个总体的统计分析比较三种端点检测方法的总体比较算法特征适用情况检测精度检测速度。(1)双门限时域范围内对声音数据的能量和过零率分析高信噪比的环境低最快。(2)小波检测频域范围内对声音数据进行小波变换后方差分析高或低信噪比的环境高慢。(3)倒谱检测频域范围内对声音数据进行倒谱变换后计算倒谱距离高或低信噪比的环境高快。通过对三种算法的比较可以发现倒谱变换的端点检测方法是最具有实用价值的。小波方法检测的声音数据虽然检测的精度很高但是检测的速度很慢相对适用于在实验室的情况下进行端点检测。参考文献[1]张雄伟等.现代语音处理技术及应用[M].北京:机械工业出版社2003.[2]胡光锐.语音处理与识别[M].上海:上海科学技术文献出版社1994.[3]蔡莲红等.现代语音技术基础及应用[M].北京:清华大学出版社2003.[4]韩纪庆等.语音信号处理[M].北京:清华大学出版社2004.[5]何湘智.语音识别的研究与发展[J].计算机与现代化200279(3).[6]赵高峰张雪英侯雪梅.一种基于小波系数方差的语音端点检测方法[J].太原理工大学学报200637(5).[7]董力陈宏钦马争鸣.基于小波变换的语音段起止端点检测算法[J].中