预览加载中,请您耐心等待几秒...
1/5
2/5
3/5
4/5
5/5

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

语音信号信号处理实验报告 实验一语音信号的端点检测 一、实验目的 1、掌握短时能量的求解方法2、掌握短时平均过零率的求解方法 3、掌握利用短时平均过零率和短时能量等特征,对输入的语音信号进行端点检测。 二、仪器设备HP计算机、Matlab软件 三、实验原理3.1、短时能量 3.1.1、原理:语音信号能量随时间有相当大的变化,特别是清音段的能量一般比浊 音段的小得多。语音信号的短时能量定义: xw(n)?w(n)?x(n)0?m?N?1 0?n?N?1?1w(n)??其它?0 n?N?12En??xw(m)m?n 3.1.2、短时能量序列反映了语音振幅或能量随着时间缓慢变化的规律。从原始语音 信号图中可以看到语音信号幅度随时间有相当大的变化,特别是清音段的幅度一般比浊音 段的幅度小很多,语音信号的短时能量给出了反映这些幅度变化的一个合适的描述方法。 3.1.3、短时平均幅度函数和能量函数的作用(1)区分清/浊音。 En、Mn大,对应浊音;En、Mn小,对应清音。其中Mn是短时幅度差。(2)在信噪 比高的情况下,能进行有声/无声判决。无声时,背景噪声的En、Mn小; 有声时,En、Mn显著增大。判决时可设置一个门限。(3)大致能定出浊音变为清音的 时刻,或反之。3.2、短时过零率: 3.2.1、定义:过零就是信号通过零值。 连续语音信号,考察其时域波形通过时间轴的情况;离散时间信号,相邻的 值改变符号则称为过零。 n?N?11Z?sgn[xw(m)]?sgn[xw(m?1)]n2m?nx(n)?0?1sgn[x(n)]?? ??1x(n)?0 窄带信号,平均过零数作为信号频率的一种简单度量是很精确的,语音信号序列是宽 带信号,则不能简单用上面的公式,但是可以用短时平均过零数来得到频谱的粗略估计。 3.2.2、短时过零分析的意义:(1)、可以区分清音与浊音:浊音时具有较低的平 均过零数,而清音时具有较高的平均过零数。(2)、利用它可以从背景噪声中找出语音 信号,可用于判断寂静无语音和有语音的起点和终点位置。(3)、在背景噪声较小时用 平均能量识别较为有效,而在背景噪声较大时用平均过零数识别较为有效。3.3、语音的 端点检测:语音信号有如下特点: (1)浊音的短时平均幅度最大,过零率最低;(2)无声的短时平均幅度最低,过 零率居中;(3)清音短时平均幅度居中,过零率最高; 根据上述特点就可以检测出语音的端点来。即区分出有声和无声的分界线。 四、实验内容 ?1、找到机器中声音文件,对其进行相应的文件操作。2、对该声音文件提取短时能 量和短时过零率。3、根据上述特征进行端点检测。4、按照实际的情况调整阈值。五、 实验步骤及程序 1、实验步骤: (1)、编写程序提取语音的短时能量,即过零率;(2)、设定阈值,进行端点检 测。 2、实验流程: 对语音信号预加重分帧读入语音信号开始 3、实验程序:端点检测: [x,fs,nbits]=wavread('1.wav');%语音信号的端点检测matlab实现x=x/ max(abs(x));%幅度归一化到[-1,1]%参数设置 FrameLen=256;%帧长 inc=90;%未重叠部分,帧移amp1=10;%短时能量阈值 amp2=2; zcr1=10;%过零率阈值 zcr2=5; minsilence=6;%用无声的长度来判断语音是否结束minlen=15;%判断是 语音的最小长度status=0;%记录语音段的状态count=0;%语音序列的 长度silence=0;%无声的长度 %计算过零率 设定阈值,amp1,amp2,zcr1,zcr2求短时过零率zcr求短时能量amp根据阈值进 行端点检测tmp1=enframe(x(1:end-1),FrameLen,inc);tmp2= enframe(x(2:end),FrameLen,inc);signs=(tmp1.*tmp2)<0;diffs=(tmp1- tmp2)>0.02;zcr=sum(signs.*diffs,2); %计算短时能量 amp=sum((abs(enframe(filter([1-0.9375],1,x),FrameLen,inc))).^2,2); %调整能量门限 amp1=min(amp1,max(amp)/4);amp2=min(amp2,max(amp)/8); %开始端点检测 forn=1:length(zcr) goto=0; switchstatus case{0,1}%0=静音,1=可能开始ifamp(n)> amp1%确信进入语音段 x1=max(n-count-1,1);%记录语音段的起始点