预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111508518A(43)申请公布日2020.08.07(21)申请号202010454159.6G06F17/14(2006.01)(22)申请日2020.05.26(66)本国优先权数据202010418547.92020.05.18CN(71)申请人中国科学技术大学地址230026安徽省合肥市包河区金寨路96号(72)发明人叶中付穆罕默德绍希杜尔·伊斯兰姆(74)专利代理机构北京科迪生专利代理有限责任公司11251代理人顾炜(51)Int.Cl.G10L21/0216(2013.01)G10L25/30(2013.01)权利要求书5页说明书8页附图1页(54)发明名称一种基于联合字典学习和稀疏表示的单通道语音增强方法(57)摘要本发明提供一种基于联合字典学习和稀疏表示的单通道语音增强方法,对干净语音做双树复数小波变换得到一组子带信号,对子带信号做短时傅里叶变换得到其时频谱,利用其幅度、实部和虚部以及语音稀疏性学习出干净语音的联合字典,同样学习出干净噪声的联合字典;对带噪语音做双树复数小波变换和短时傅里叶变换,获得每个子带信号时频谱,保留相位和实部虚部符号,提取幅度、实部和虚部绝对值并分别在干净语音和干净噪声联合字典上投影,得到语音和噪声的稀疏表示系数,利用该系数、时频谱相位和实部虚部符号以及掩码、权值等,得到该子带语音时频谱的最终估计,做短时傅里叶逆变换和双树复数小波逆变换,得到增强后的语音信号,提高了语音增强能力。CN111508518ACN111508518A权利要求书1/5页1.一种基于联合字典学习和稀疏表示的单通道语音增强方法,其特征在于,包括:步骤1、训练阶段步骤11、构建干净语音和干净噪声的训练数据集;步骤12、用双树复数小波变换(DTCWT)分别将干净语音和干净噪声训练数据集中的干净语音信号str(t)和干净噪声训练信号ntr(t)分解为一组子带信号和即:其中DTCWT{}为双树复数小波变换算子,J,b,tl分别表示DTCWT的层数、子带数和树层数;步骤13、对语音和噪声的每一子带信号分别用短时傅里叶变换得到时频域上的复数谱,即:其中,STFT{}为短时傅里叶变换算子,tf,f分别为时间帧和频率点,分别为幅度、实部和虚部,分别为的幅度、实部和虚部;步骤14、采用LARC算法和K-SVD算法分别学习干净语音和干净噪声复数谱的幅度、实部和虚部绝对值,得到相应的联合字典和字典的学习过程如下:2CN111508518A权利要求书2/5页其中,分别是干净语音子带信号的幅度、实部和虚部字典;是干净语音子带信号的稀疏表示系数;干净语音子带信号的稀疏表示系数为矩阵形式,为的第g列;分别是干净噪声子带信号的幅度、实部和虚部字典;是干净噪声子带信号的稀疏表示系数;干净噪声子带信号的稀疏表示系数为矩阵形式,为的第g列,q为稀疏约束;代表的是弗罗贝尼乌斯范数,||·||1代表的是1-范数;步骤2、检测阶段步骤21、带噪语音信号为x(t)=s(t)+n(t),用双树复数小波变换(DTCWT)将其分解为一组子带信号即:其中,DTCWT{}为双树复数小波变换算子,J,b,tl分别表示DTCWT的层数、子带数和树层数;步骤22,对带噪语音的每一子带信号分别用短时傅里叶变换得到时频域上的复数谱,即:其中,STFT{}为短时傅里叶变换算子,tf,f分别为时间帧和频率点,分别为幅度、实部和虚部,提取相应的幅度、实部和虚部绝对值,并保留相位信息以及实部、虚部符号留待进一步处理;步骤23,把带噪语音的每一子带信号的复数谱的幅度、实部和虚部绝对值组织起来,3CN111508518A权利要求书3/5页并在干净语音和干净噪声的联合字典和上分别进行对应投影,获得投影的语音和噪声稀疏表示系数,计算如下:其中,分别为在联合字典上的候选稀疏表示系数,为通过上述式子从候选稀疏表示系数中选出的最优稀疏表示系数;稀疏表示系数为矩阵形式,分别为的第g列;分别为在联合字典上的候选稀疏表示系数,为通过上述式子从候选稀疏表示系数中选出的最优稀疏表示系数;稀疏表示系数为矩阵形式,分别为的第g列;q为稀疏约束;4CN111508518A权利要求书4/5页步骤24,对带噪语音的每一子带语音信号复数谱的初始估计;首先,利用稀疏表示系数计算出各个字典重建出的语音和噪声复数谱的幅度、实部和虚部绝对值,如下式所示:其次,由和保留的相位重建出第一种子带语音信号复数谱由和以及保留的和符号重建出第二种子带语音信号复数谱称之为初始估计;同样,可以得到两种子带噪声信号复数谱的初始估计:步骤25,对带噪语音的每一子带语音信号复数谱的最终估计;首先,根据带噪语音的每一子带信号的复数谱的两种初始估计,分别计算比例掩码:其次,完