一种车载环境下的语音增强方法和语音识别方法-豆柴文库

一种车载环境下的语音增强方法和语音识别方法.pdf

2023-11-06

10金币

683KB

11页

一条****发啊

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共11页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114387953A(43)申请公布日2022.04.22(21)申请号202210088439.9(22)申请日2022.01.25(71)申请人重庆卡佐科技有限公司地址401121重庆市渝北区财富大道19号1幢（财富三号A栋）3楼5号(72)发明人向导王征向一品(51)Int.Cl.G10L15/02(2006.01)G10L15/06(2013.01)G10L15/16(2006.01)G10L21/0224(2013.01)G10L21/0264(2013.01)G10L25/21(2013.01)G10L25/45(2013.01)权利要求书1页说明书6页附图3页(54)发明名称一种车载环境下的语音增强方法和语音识别方法(57)摘要本申请公开了一种车载环境下的语音增强方法和语音识别方法，将改进的谱减法结合模糊理论，使得谱减法系数能够自适应不同的语音信号，能够有效的消除噪音，避免“音乐噪音”问题，同时提高信噪比，保留了语音信号的有效信号。通过实际仿真运算和车内实验，采用本文算法后，能够有效提高行驶车内的语音识别准确率。CN114387953ACN114387953A权利要求书1/1页1.一种车载环境下的语音增强方法，其特征在于，包括如下步骤：对车载环境下的原始语音信号进行分帧处理和加窗处理后得到时域语音信号x(k)，其中，时域噪声信号用n(k)表示，时域纯净语音信号用s(k)表示；将时域语音信号x(k)进行傅里叶变换，得到功率谱Px(w)，同时保留原始语音信号的相位根据功率谱Px(w)估算得到时域噪声信号n(k)的功率谱Pn(w)；时域纯净语音信号s(k)的功率谱用Ps(w)表示，则有公式：其中α和β为根据功率谱Px(w)的平均幅值A与最大幅值M自适应变化的参数，α的取值范围为0＜α＜5，β的取值范围为0＜β＜1；根据所述公式计算得到功率谱Ps(w)，将功率谱Ps(w)结合原始语音信号的相位进行傅里叶逆变换后得到时域纯净语音信号s(k)，完成原始语音输入信号增强。2.根据权利要求1所述的语音增强方法，其特征在于，α和β根据功率谱Px(w)的平均幅值A与最大幅值M自适应变化的步骤包括：将所述平均幅值A与最大幅值M输入已构建完成的模糊控制器，由所述模糊控制器输出α和β的取值。3.根据权利要求2所述的语音增强方法，其特征在于，所述模糊控制器的输入和输出分别划分为七级。4.根据权利要求2所述的语音增强方法，其特征在于，所述模糊控制器的隶属度函数采用高斯型函数。5.根据权利要求2所述的语音增强方法，其特征在于，所述模糊控制器采用max方法进行模糊合成，采用重心法解模糊。6.一种车载环境下的语音识别方法，其特征在于，包括如下步骤：获取车载环境下的原始语音信号；对所述原始语音信号进行预处理，所述预处理包括：按照权利要求1‑5任意一项所述的语音增强方法完成语音增强；对完成预处理的语音信号进行特征提取；将完成特征提取的语音信号输入训练完成的卷积神经网络模型进行语音识别，由所述卷积神经网络输出语音识别结果。7.根据权利要求6所述的语音识别方法，其特征在于，采用MFCC方法对完成预处理的信号进行特征提取。8.根据权利要求7所述的语音识别方法，其特征在于，所述卷积神经网络模型包括1个输入层、6个卷积层、6个dropout层和1个全连接层。2CN114387953A说明书1/6页一种车载环境下的语音增强方法和语音识别方法技术领域[0001]本申请属于语音识别技术领域，具体涉及一种车载环境下的语音增强方法和语音识别方法。背景技术[0002]在车辆驾驶舱内为了减少用户的按钮需求、提高人车交互便利性，语音识别技术得到了广泛应用。但语音识别过程极易受到环境噪音的干扰，驾驶舱内的车辆发动机、变速箱、电机、空气噪音和胎噪等各种噪音给语音识别带来了极大的挑战，导致语音识别准确率降低和用户体验变差。[0003]语音增强的目的是在尽可能保留语音信号中有用信号的同时衰减掉车内外的杂音，进而提高语音识别准确率。常见的语音增强方法有：维纳滤波法、同态滤波法和谱减法等。其中谱减法因为算法简单方便，在语音识别领域得到了广泛应用，但同时谱减法也有其缺点：一是谱减过程中产生一部分的负幅值；二是谱减过程会残留部分噪音，从而导致“音乐噪音”问题。[0004]技术方案[0005]为了解决至少一项上述问题，本申请提出了一种车载环境下的语音增强方法和语音识别方法，可以有效提高语音信噪比，提高语音识别准确率，同时该方法适应性好，能够有效避免“音乐噪音”问题。[0006]第一方面，本申请提供的一种车载环境下的语音增强方法，包括：[0007]对车载环境下的原始语音信号进行分帧处理和加窗处理后得到时域语音信号x(k)

相关资料

一种车载环境下的语音增强方法和语音识别方法.pdf

本申请公开了一种车载环境下的语音增强方法和语音识别方法，将改进的谱减法结合模糊理论，使得谱减法系数能够自适应不同的语音信号，能够有效的消除噪音，避免“音乐噪音”问题，同时提高信噪比，保留了语音信号的有效信号。通过实际仿真运算和车内实验，采用本文算法后，能够有效提高行驶车内的语音识别准确率。

2023-11-06

683KB

车载语音识别方法及装置.pdf

本发明提供的一种车载语音识别方法及装置，涉及语音识别技术领域，可以实现车载语音识别系统服务于驾驶员以外的乘客。所述方法包括：获取车内每个座位上配置的拾音模组麦克接收的语音信息，其中，每个拾音模组麦克接收对应座位乘客输入的语音信息；再对所述语音信息进行降噪处理；然后根据所述语音信息中每一路语音信息对应的参数信息，对降噪处理后的语音信息进行信号处理得到语音信号；最后对所述语音信号进行语音识别。本发明适用于车载语音的识别。

2023-12-06

554KB

一种语音增强方法、语音识别方法、聚类方法及装置.pdf

本发明公开一种语音增强方法、语音识别方法、聚类方法及装置。方法包括：选取与测试语音的第一帧语音部分的特征向量最匹配的特征向量聚类中心；针对测试语音包含的其他各帧语音部分的特征向量执行：从与该语音部分的前一帧语音部分的特征向量最匹配的特征向量聚类中心，以及与前一帧语音部分的特征向量最匹配的特征向量聚类中心相邻的特征向量聚类中心中，选取与该语音部分的特征向量最匹配的特征向量聚类中心；根据测试语音包含的各帧语音部分的特征向量、选取的特征向量聚类中心重建测试语音的特征向量。本发明由于在进行语音增强利用了能够表示语

2023-12-06

660KB

车载语音识别系统的语音增强方法研究.docx

车载语音识别系统的语音增强方法研究摘要随着车载语音交互系统的普及，语音交互成为了车内操作的重要方式。然而，车内环境噪声、驾驶员口齿不清等问题成为了车载语音识别系统的瓶颈，影响了交互的效率和准确性。为解决这些问题，本文研究了车载语音识别系统的语音增强方法，包括基于信号处理的语音增强方法和基于机器学习的语音增强方法。经过实验验证，基于机器学习的语音增强方法在车载语音识别系统中具有良好的效果和实用性。关键词：车载语音交互；语音增强；信号处理；机器学习AbstractWiththepopularityofin-c

2024-10-16

12KB

用于车载的语音识别方法及系统.pdf

本发明实施例提供一种用于车载的语音识别方法。该方法包括：使用多个麦克风对车载空间进行音区信号分离，至少将车载空间分为多个音区，根据各音区内的麦克风组成分布式麦克风网络；通过分布式麦克风网络实时采集车载环境下的音频，根据回声消除算法抑制音频中的车载环境自噪声；通过盲源分离算法对抑制音频中多个说话人的声音进行分离；通过分布式麦克风网络定位每个说话人所在的音区，没有说话人发出的声音时，将声音采集为噪音估计，有说话人发出的声音时，根据前一帧采集的噪音估计进行降噪，确定出干净语音进行语音识别。本发明实施例还提供一种

2023-06-27

590KB