预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114387953A(43)申请公布日2022.04.22(21)申请号202210088439.9(22)申请日2022.01.25(71)申请人重庆卡佐科技有限公司地址401121重庆市渝北区财富大道19号1幢(财富三号A栋)3楼5号(72)发明人向导王征向一品(51)Int.Cl.G10L15/02(2006.01)G10L15/06(2013.01)G10L15/16(2006.01)G10L21/0224(2013.01)G10L21/0264(2013.01)G10L25/21(2013.01)G10L25/45(2013.01)权利要求书1页说明书6页附图3页(54)发明名称一种车载环境下的语音增强方法和语音识别方法(57)摘要本申请公开了一种车载环境下的语音增强方法和语音识别方法,将改进的谱减法结合模糊理论,使得谱减法系数能够自适应不同的语音信号,能够有效的消除噪音,避免“音乐噪音”问题,同时提高信噪比,保留了语音信号的有效信号。通过实际仿真运算和车内实验,采用本文算法后,能够有效提高行驶车内的语音识别准确率。CN114387953ACN114387953A权利要求书1/1页1.一种车载环境下的语音增强方法,其特征在于,包括如下步骤:对车载环境下的原始语音信号进行分帧处理和加窗处理后得到时域语音信号x(k),其中,时域噪声信号用n(k)表示,时域纯净语音信号用s(k)表示;将时域语音信号x(k)进行傅里叶变换,得到功率谱Px(w),同时保留原始语音信号的相位根据功率谱Px(w)估算得到时域噪声信号n(k)的功率谱Pn(w);时域纯净语音信号s(k)的功率谱用Ps(w)表示,则有公式:其中α和β为根据功率谱Px(w)的平均幅值A与最大幅值M自适应变化的参数,α的取值范围为0<α<5,β的取值范围为0<β<1;根据所述公式计算得到功率谱Ps(w),将功率谱Ps(w)结合原始语音信号的相位进行傅里叶逆变换后得到时域纯净语音信号s(k),完成原始语音输入信号增强。2.根据权利要求1所述的语音增强方法,其特征在于,α和β根据功率谱Px(w)的平均幅值A与最大幅值M自适应变化的步骤包括:将所述平均幅值A与最大幅值M输入已构建完成的模糊控制器,由所述模糊控制器输出α和β的取值。3.根据权利要求2所述的语音增强方法,其特征在于,所述模糊控制器的输入和输出分别划分为七级。4.根据权利要求2所述的语音增强方法,其特征在于,所述模糊控制器的隶属度函数采用高斯型函数。5.根据权利要求2所述的语音增强方法,其特征在于,所述模糊控制器采用max方法进行模糊合成,采用重心法解模糊。6.一种车载环境下的语音识别方法,其特征在于,包括如下步骤:获取车载环境下的原始语音信号;对所述原始语音信号进行预处理,所述预处理包括:按照权利要求1‑5任意一项所述的语音增强方法完成语音增强;对完成预处理的语音信号进行特征提取;将完成特征提取的语音信号输入训练完成的卷积神经网络模型进行语音识别,由所述卷积神经网络输出语音识别结果。7.根据权利要求6所述的语音识别方法,其特征在于,采用MFCC方法对完成预处理的信号进行特征提取。8.根据权利要求7所述的语音识别方法,其特征在于,所述卷积神经网络模型包括1个输入层、6个卷积层、6个dropout层和1个全连接层。2CN114387953A说明书1/6页一种车载环境下的语音增强方法和语音识别方法技术领域[0001]本申请属于语音识别技术领域,具体涉及一种车载环境下的语音增强方法和语音识别方法。背景技术[0002]在车辆驾驶舱内为了减少用户的按钮需求、提高人车交互便利性,语音识别技术得到了广泛应用。但语音识别过程极易受到环境噪音的干扰,驾驶舱内的车辆发动机、变速箱、电机、空气噪音和胎噪等各种噪音给语音识别带来了极大的挑战,导致语音识别准确率降低和用户体验变差。[0003]语音增强的目的是在尽可能保留语音信号中有用信号的同时衰减掉车内外的杂音,进而提高语音识别准确率。常见的语音增强方法有:维纳滤波法、同态滤波法和谱减法等。其中谱减法因为算法简单方便,在语音识别领域得到了广泛应用,但同时谱减法也有其缺点:一是谱减过程中产生一部分的负幅值;二是谱减过程会残留部分噪音,从而导致“音乐噪音”问题。[0004]技术方案[0005]为了解决至少一项上述问题,本申请提出了一种车载环境下的语音增强方法和语音识别方法,可以有效提高语音信噪比,提高语音识别准确率,同时该方法适应性好,能够有效避免“音乐噪音”问题。[0006]第一方面,本申请提供的一种车载环境下的语音增强方法,包括:[0007]对车载环境下的原始语音信号进行分帧处理和加窗处理后得到时域语音信号x(k)