预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112201269A(43)申请公布日2021.01.08(21)申请号202011119852.4(22)申请日2020.10.19(71)申请人成都明杰科技有限公司地址610000四川省成都市双流区东升街道龙桥路6号129栋1单元9层902号(72)发明人冯谦(74)专利代理机构成都四合天行知识产权代理有限公司51274代理人冯龙王记明(51)Int.Cl.G10L21/0208(2013.01)G10L21/0216(2013.01)G10L25/21(2013.01)G10L25/45(2013.01)权利要求书2页说明书7页附图1页(54)发明名称基于改进噪声估计的MMSE-LSA语音增强方法(57)摘要本发明公开了一种基于改进噪声估计的MMSE‑LSA语音增强方法,包括:S1:对带噪语音进行分帧、加窗处理,做短时傅里叶变换,求出带噪语音的幅度谱和相角;S2:计算出带噪语音的对数能量和谱熵,构建出新的语音特征参数能熵比;S3:得到能熵比和语音存在概率成正比关系,建立能熵比和语音存在概率的数学关系模型,得到语音存在概率估计值;S4:对语音存在概率估计值进行平滑,利用平滑后的语音存在概率来更新噪声功率谱估计;S5:计算出先验信噪比从而得到谱增益估计,给增益函数添加一个约束阈值;S6:利用MMSE‑LSA谱估计器对带噪语音进行语音增强;通过对语音特征参数能熵比的构建,减小噪声残留和语音失真,达到改善语音质量的目的。CN112201269ACN112201269A权利要求书1/2页1.基于改进噪声估计的MMSE-LSA语音增强方法,其特征在于,包括以下步骤:S1:对带噪语音进行分帧、加窗处理,再对其做短时傅里叶变换,求出带噪语音的幅度谱和相角;S2:根据步骤S1的结果,计算出带噪语音的对数能量和谱熵,构建出新的语音特征参数能熵比;S3:根据步骤S2中的能熵比和语音存在概率的性质,得到能熵比和语音存在概率成正比关系,建立能熵比和语音存在概率的数学关系模型,得到语音存在概率估计值;S4:对步骤S3中得出的语音存在概率估计值进行平滑,利用平滑后的语音存在概率来更新噪声功率谱估计;S5:根据步骤S4的结果计算出先验信噪比从而得到谱增益估计,给增益函数添加一个约束阈值;S6:根据谱估计,并利用MMSE-LSA谱估计器对带噪语音进行语音增强。2.根据权利要求1所述的基于改进噪声估计的MMSE-LSA语音增强方法,其特征在于,在所述步骤S2中,所述对数能量根据语音段的短时能量大于无语音段可得,具体如下,若假设经分帧加窗后第i帧的带噪语音信号为yi(m),则该帧的短时能量为:其中,N为帧长,进一步改进能量计算得到对数能量:LE(i)=log10(1+E(i)/a)式中,a取2.1。3.根据权利要求1所述的基于改进噪声估计的MMSE-LSA语音增强方法,其特征在于,在所述步骤S2中,所述谱熵由下式可得,设含噪语音信号加窗分帧后的第i帧语音信号为yi(m),经傅里叶变换后,设第k个频率2分量的功率谱为Yi(ωk),则每个频率分量的归一化概率密度函数为:则每个分析帧的谱熵为:4.根据权利要求1所述的基于改进噪声估计的MMSE-LSA语音增强方法,其特征在于,在所述步骤S3中,所述能熵比和语音存在概率的数学关系模型的建立过程如下,令Wi(ωk)为能熵比,则其表达式为:可将能熵比与语音存在概率的关系估计为:2CN112201269A权利要求书2/2页其中,a、b均为控制参数。语音存在概率的取值范围为0到1之间,在a取值相同时,b增大,增大;在信噪比较低时,语音存在的概率密度函数较小,此时b取0.8。5.根据权利要求1所述的基于改进噪声估计的MMSE-LSA语音增强方法,其特征在于,在所述步骤S4中,对估计出的语音存在概率进行递归平滑,其平滑形式如下:其中,ap为平滑参数,分别为当前帧和前一帧的第k个频率分量的语音存在概率估计值。6.根据权利要求1所述的基于改进噪声估计的MMSE-LSA语音增强方法,其特征在于,在所述步骤S5中,采用如下判决引导法估计出先验信噪比εk,其中η是平滑系数,取0.98。7.根据权利要求1所述的基于改进噪声估计的MMSE-LSA语音增强方法,其特征在于,在所述步骤S5中,通过给MMSE-LSA谱增益添加一个门限阈值来约束增益取值范围,约束谱增益如下:式中,ε0为先验信噪比阈值,Gfloor为常数,取0.01。3CN112201269A说明书1/7页基于改进噪声估计的MMSE-LSA语音增强方法技术领域[0001]本发明涉及改进噪音的语音增强领域,具体是基于改进噪声估计的MMSE-LSA语音增强方法。背景技术[0002]噪声污染会使语音中的有用信息被