预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局*CN102760435A*(12)发明专利申请(10)申请公布号CN102760435A(43)申请公布日2012.10.31(21)申请号201210227840.2(22)申请日2012.07.03(71)申请人合肥工业大学地址230009安徽省合肥市屯溪路193号(72)发明人丁志中黄玉雷戴礼荣陈小平(74)专利代理机构安徽合肥华信知识产权代理有限公司34112代理人余成俊(51)Int.Cl.G10L15/18(2006.01)权利要求书权利要求书2页2页说明书说明书55页页附图附图11页(54)发明名称一种语音信号频域盲解卷积方法(57)摘要本发明公开了一种语音信号频域盲解卷积方法,将时域卷积混合的语音信号变换到频域进行盲分离,根据语音信号的短时平稳性,将时域卷积混合信号通过加窗傅里叶变换转变成频域线性瞬时混合模型,在频域中滤波、白化等预处理后,采用不同时延下相关矩阵近似联合对角化的方法实现分段语音信号盲分离,在解决了信号盲分离的模糊性问题后,经过傅立叶逆变换在时域中进行分段分离信号重组。本发明对2×2实录混合语音信号具有良好的分离效果,并能有效地提高存在他人说话干扰环境下人机交互系统的语音信号识别正确率。CN10276435ACN102760435A权利要求书1/2页1.一种语音信号频域盲解卷积方法,其特征在于:将时域卷积混合的语音信号变换到频域进行盲分离,具体包括以下步骤:1)对原始音频文件的自适应分帧,当采样频率为16KHz时,帧长取16ms,帧移取2ms;2)对单帧数据进行傅里叶变换,将卷积混合信号模型转变为线性混合模型;卷积混合模型可以表示为(表示卷积)(1)信号的短时傅里叶变换可以表示为其中;X(ω,ts)是x(t)的短时傅里叶变换,w(t)是窗函数;假定混合系统是时变的,由(1)式可得其中H(ω)和S(ω,ts)分别是混合滤波器H(p)和源信号s(t)的傅里叶变换,H(ω)可以在每个频率点单独进行估计;3)采用特征值分解对输入信号进行白化处理;混合信号的协方差矩阵可被分解为这里Λ=diag(d1,d2,…dn)是对角矩阵,其元素是协方差矩阵Rx(0)的特征值,Q是对应的特征向量,Q-1是Q的逆矩阵;白化矩阵V可以表示为是协方差矩阵Λ的逆矩阵的平方根;4)相关矩阵联合对角化,即寻找一个旋转矩阵U,使得下式达到最小;这里Rz(τ)定义为频域解混合矩阵W为5)定义输出信号频谱Y1(ω)和Y2(ω),幅度a1(ω)和a2(ω)相关系数为2CN102760435A权利要求书2/2页其中协方差为a1(ω,m)示在第一个信号在m窗口且频率为ω的信号分量幅度;6)计算参数|r(a1(ωm),a1(ωm+1))|,|r(a2(ωm),a2(ωm+1))|,|r(a1(ωm),a2(ωm+1))|,|r(a2(ωm),a1(ωm+1))|,确定信号重组;7)计算(2)式的短时傅里叶逆变换这里3CN102760435A说明书1/5页一种语音信号频域盲解卷积方法技术领域[0001]本发明属于多媒体信息处理中语音信号提取与识别领域,具体涉及一种语音信号频域盲解卷积方法,可应用于人机交互场景中提高交互识别率。背景技术[0002]自动语音识别技术经过60余年的发展,在无噪声或无干扰环境下,识别率已经超过95%。但是在实际应用环境中尤其是两个或多个说话人同时说话时,语音识别率骤然下降,这极大的限制了该技术在人机交互(Human-MachineInteraction,HMI)中的应用。人类的听觉系统能在嘈杂的环境中获取自己感兴趣的信息,而处于人机交互环境下的机器人很难拥有此能力。盲信号分离就是在原始信号和传输通道均未知的情况下仅由接收传感器得到的混合信号来估计原始信号的一种技术。[0003]HMI环境下的盲分离属于盲解卷范畴,对于卷积混合信号或者真实环境下混合语音信号,学术界主要有两种方法对其进行解卷积,一种是时域盲解卷,另一种是频域盲解卷。时域盲解卷主要是基于ICA概念将线性瞬时混合情况下的标量混合矩阵扩展为卷积混合情况下的滤波器混合矩阵,并对目标函数和迭代算法做一定的修正。频域盲解卷算法的基本思想是利用短时傅里叶变换将时域卷积混合信号变换为频域瞬时混合信号,再利用较为成熟的瞬时混合盲分离算法对频域混合信号进行分离,即在频域里每一个频点利用瞬时混合的盲分离算法进行分离,解决输出信号的次序不确定以及信号幅度不确定之后再通过逆傅里叶变换得到分离后的时域信号。[0004]时域盲解卷的劣势在于计算量太大,尤其是当混合滤波器较为复杂时,求解滤波器的每一阶都要依靠其余阶的求解。例如Chan提出的对角常数化分离矩阵算法,混合滤波器为5阶以下时,算法能快速的分离混合信号,而当滤波器的阶数为6阶以上时,分离速度明显