预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局*CN102184732A*(12)发明专利申请(10)申请公布号CN102184732A(43)申请公布日2011.09.14(21)申请号201110109168.2(22)申请日2011.04.28(71)申请人重庆邮电大学地址400065重庆市南岸区崇文路2号(72)发明人张毅罗元李敏蔡军谢颖林海波黄璜李艳花(74)专利代理机构北京同恒源知识产权代理有限公司11275代理人赵荣之(51)Int.Cl.G10L15/02(2006.01)G10L15/04(2006.01)权利要求书4页说明书8页附图2页(54)发明名称基于分形特征的智能轮椅语音识别控制方法及系统(57)摘要本发明公开了一种基于分形特征的智能轮椅语音识别控制方法,涉及语音识别方法,首先将语音信号输入,再进行预处理和特征参数提取,然后与模板库中的模板进行匹配判断获得命令控制智能轮椅,采用将语音信号的分形特征参数和传统的MFCC特征参数有机结合得到的混合特征参数,提高了系统的识别率,用于智能轮椅语音控制系统中的语音识别,实现了对智能轮椅的精确控制,达到用户与智能轮椅之间语音交互的目的,同时,这种混合特征参数提取方法还适用于其它的语音识别系统,另外还公开了一种基于分形特征的智能轮椅语音识别控制系统,包括语音信号输入模块,预处理模块,特征参数提取模块,匹配模块,判断模块,命令转换模块,控制模块。CN1028473ACCNN110218473202184736A权利要求书1/4页1.基于分形特征的智能轮椅语音识别控制方法,其特征在于:包括以下步骤:S1:语音信号命令词输入;S2:对语音信号进行预处理;S3:提取经过预处理后语音信号的特征参数;S4:将特征参数与模板库的模板进行模式匹配;S5:选择匹配相似度最高的模板作为识别结果;S6:将该识别结果转换成智能轮椅的运动命令;S7:调用相应的控制函数,驱动智能轮椅按照语音信号进行运动。2.根据权利要求1所述的基于分形特征的智能轮椅语音识别控制方法,其特征在于:所述步骤S2中的预处理,包括语音的预加重滤波、加窗分帧处理与双门限端点检测。3.根据权利要求1所述的基于分形特征的智能轮椅语音识别控制方法,其特征在于:所述步骤S3中的特征提取包括以下步骤:S31:提取语音信号的Mel频率倒谱系数MFCC参数;S311:首先确定每一帧语音采样序列的点数,对每帧序列s(n)进行预加重滤波处理;S312:再进行离散傅立叶变换FFT变换,取模的平方得到离散功率谱S(n);S313:在语音的频谱范围内设置若干个带通滤波器;在某一频谱范围内的语音可以通过此带通滤波器,而其它范围的语音频谱被衰减至极低值。此带通滤波器如下:Hm(n),m=0,1,·,M-1,n=0,1,·,N/2-1其中Hm(n)为每个带通滤波器的传递函数,M为滤波器的个数,通常取24,N为一帧语音信号的点数;S314:将离散功率谱转换为Mel频率下的功率谱S(n);计算S(n)通过M个Hm(n)后所得的功率值,即计算S(n)和Hm(n)在各离散频率点上乘积之和,得到M个参数Pm,m=0,1,·,M-1,此处Pm为中心频率;S315:计算Pm的自然对数,得到Lm,m=0,1,·,M-1,此处Lm为对数频谱。S316:对L0,L1,·,Lm-1计算其离散余弦变换,得到Dm,m=0,1,·,M-1;S317:舍去代表直流成分的D0,取D1,D2,·,DK作为MFCC参数;S32:提取语音的动态特征,作为一帧语音信号的特征参数,用差分倒谱参数来描述语音的动态特征,计算公式为:其中c和d都表示一帧语音参数,k为常数,通常取2,差分参数就称为当前帧的前两帧和后两帧参数的线性组合;由此式计算得到的差分参数为一阶MFCC差分参数,实际使用中,将MFCC参数和各阶MFCC差分参数合并为一个矢量;S33:提取语音信号的分形维数作为分形特征;S331:将语音信号归一化到单位正方形区域,得到归一化信号x(t);S332:将正方形区域划分为边长为s的网格,计算出logN(s),log(1/s),N(s)表示用边长为s的网格覆盖x(t)所需要的最小正方形个数,改变s的大小,计算相应的logN(s),log(1/s);2CCNN110218473202184736A权利要求书2/4页S333:令xi=log(1/si),yi=logN(si),i=1,2,·,M,利用(xi,yi)最小二乘拟合直线y=kx+b,k即为计盒维数DB,DB的计算公式为:语音信号的分形特征由分形维数来定量表征;由此求出语音信号的分形特征值作为语音信号的特征参数;S34:提取混合特征参数,将分形维数DB和一阶MFCC差分参数合并到MFCC参数中组成混合的特征参数MFCC+ΔMFCC+D;其中,