预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112634927A(43)申请公布日2021.04.09(21)申请号202011404180.1(22)申请日2020.12.03(71)申请人电子科技大学地址611731四川省成都市高新区(西区)西源大道2006号(72)发明人陈延涛董彬虹张晓雪韩耀华刘天昊(74)专利代理机构电子科技大学专利中心51203代理人陈一鑫(51)Int.Cl.G10L21/0216(2013.01)G10L25/30(2013.01)权利要求书2页说明书5页附图1页(54)发明名称一种短波信道语音增强方法(57)摘要该发明公开了一种短波信道语音增强方法,属于通信技术领域。本发明提出将神经网络应用于短波通信语音降噪模块,并根据Anti‑fadingNet和DenoisingNet的性能需求与特点,选择了相同的基于映射的卷积神经网络,能取得更好的噪声抑制效果;将卷积神经网络降噪模型DenoisingNet与现有的经典非监督语音增强算法OMLSA结合,以等增益合并的方式,保留两种算法降噪的优势,从而提高单独使用DenoisingNet或OMLSA算法的降噪语音质量;第三,本发明通过堆叠两个结构简单的卷积神经网络,取得了比一般的复杂结构神经网络更好的降噪效果。CN112634927ACN112634927A权利要求书1/2页1.一种短波信道语音增强方法,该方法包括神经网络训练阶段,和语音增强阶段;所述步骤神经网络训练阶段包括如下步骤:步骤1:由纯净语音数据集xtrain构造含有信道衰落的短波语音数据集和含噪语音数据集其中,htrain表示衰落短波信道,xtrain表示纯净语音数据集,ntrain为指定信噪比的加性噪声,“*”表示卷积;将纯净语音数据集xtrain、衰落短波语音数据集和含噪语音数据集经过短时傅里叶变换进行特征提取,获得相应语音信号的幅度谱数据集|Xtrain|、和转入步骤2;步骤2:训练衰落补偿卷积神经网络模型,将步骤1所得的衰落短波语音幅度谱数据集作为输入信号,将含噪语音幅度谱数据集作为目标,进行卷积神经网络训练,最终获得具有抗衰落神经网络模型Anti‑fadingNet,转入步骤3;步骤3:训练噪声抑制卷积神经网络模型,将步骤1所得的含噪语音幅度谱数据集作为输入信号,纯净语音幅度谱数据集|Xtrain|作为目标,进行卷积神经网络训练,最终获得具有噪声抑制神经网络模型DenoisingNet,转入步骤4;所述语音增强阶段包括如下步骤:步骤4:接收机接收到短波信号后进行下变频和SSB解调后,获得待增强的接收语音ytest,对ytest进行短时傅里叶变换并提取其相位信息和幅度谱转入步骤5;步骤5:使用步骤2获得的抗衰落神经网络模型Anti‑fadingNet处理步骤4得到的待增强语音信号幅度谱以移除短波信道衰落的影响,从而获得均衡后的语音信号幅度谱转入步骤6;步骤6:使用最优修正对数谱估计非监督算法处理步骤5所得的语音信号幅度谱获得该方法增强的语音信号幅度谱转入步骤7;步骤7:使用步骤3获得的噪声抑制神经网络模型DenoisingNet对步骤5所得的语音信号幅度谱获得基于卷积神经网络增强的语音信号幅度谱转入步骤8;步骤8:将步骤6基于最优修正对数谱估计非监督算法获得的增强语音信号幅度谱和步骤7基于卷积神经网络获得的增强语音信号幅度谱等增益合并,获得本发明方法增强后的短波语音信号幅度谱|Xtest|;即2CN112634927A权利要求书2/2页转入步骤9;步骤9:将步骤8获得的增强后语音信号幅度谱|Xtest|结合步骤4所得的短波语音信号相位信息对信号重构,从而获得最终增强后的语音信号|xtest|,完成短波语音增强。2.如权利要求1所述的一种短波信道语音增强方法,其特征在于,所述抗衰落神经网络模型Anti‑fadingNet和噪声抑制神经网络模型DenoisingNet的结构相同;两者都包含4个卷积层和1个全连接层,使用连续的11帧幅度谱作为输入层的输入特征图,使用第6帧语音的幅度谱作为目标。3.如权利要求2所述的一种短波信道语音增强方法,其特征在于,所述4个卷积层的参数表示为{卷积核大小,卷积层通道数,卷积步长},前3层参数具体表示为{(5×1),64,(2,1)},第4个卷积层参数具体为{(5×1),192,(2,1)};4层卷积层的输出特征图表示为(特征图尺寸×特征图数量×训练批次(Batch)大小),依次具体表示为(65×64×200),(33×64×200),(17×64×200)和(9×192×200);所述全连接层的神经元数目为1024,使用PReLU作为激活函数。3CN112634927A说明书1/5页一种短波信道语音增强方法技术领域[000