预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105957536A(43)申请公布日2016.09.21(21)申请号201610260050.2(22)申请日2016.04.25(71)申请人南京奇音石信息技术有限公司地址211100江苏省南京市江宁区东麒路33号(72)发明人唐明(74)专利代理机构无锡华源专利商标事务所(普通合伙)32228代理人聂汉钦(51)Int.Cl.G10L21/0232(2013.01)H04M9/08(2006.01)权利要求书4页说明书10页附图2页(54)发明名称基于通道聚合度频域回声消除方法(57)摘要本发明公开了一种基于通道聚合度频域回声消除方法,包括以下步骤:步骤1、麦克风通道聚合度评估,去除冗余信息;步骤2、回声响应函数估计及回声消除;步骤3、系统噪声消除及目标语音增强。本发明采用频域滤波器,可以适应于长混响情况下,回声残留能量低,语音扭曲小;可以同时抑制多通道回声和系统的平稳噪声,语音通讯质量更高;增加了语音扭曲抑制模块,可以处理双端说话人同时说话的应用场景,语音纯净度更高。CN105957536ACN105957536A权利要求书1/4页1.一种基于通道聚合度频域回声消除方法,其特征在于,包括以下步骤:步骤1、麦克风通道聚合度评估;设定共有M路扬声器信号,N个近场麦克风信号;M路扬声器参考信号由远场同一点源信号所发出;假设从第一帧开始,一直到第lS=50帧,一直没有目标语音,1<<L<<ls;则对每一个频带k,计算参考信号的自相关矩阵的特征值分解;之后对特征值λ进行降序排列,构造N个近场麦克风信号中各语音通道的聚合度评估函数:根据如下准则评估聚合度及冗余信息:J(I)>0.95,J(I-1)<0.95,即只保留前I个特征向量所构成的自相关矩阵,剩余信息作为冗余信息;步骤2、回声响应函数估计及回声消除;对所有的N个麦克风,构造回声预测滤波器为:上式中,是参考信号向量在前I个特征空间的投影向量的自相关矩阵,ΓPY,i是投影向量与麦克风接收信号的互相关向量;i=1,2,...,N;在每一个麦克风上估计回声并消除回声,信号输出为:步骤3、系统噪声消除及目标语音增强;构造语音拾取滤波器:上式中,Hi为房间冲击响应估计;构造噪音拾取滤波器组:计算目标语音估计:上式中,ΓU为噪音拾取自相关估计,ΓU,DS为语音拾取互相关估计。2.如权利要求1所述的基于通道聚合度频域回声消除方法,其特征在于,所述步骤1具体为:设定共有M路扬声器参考信号,N个近场麦克风信号;M路扬声器参考信号由远场同一点源信号所发出,分别表示为r1(t),r2(t),...,rM(t);N个麦克风采集到的信号记为y1(t),y2(t),...,yN(t),可以表示为:式(1)中,hi,m(t)代表扬声器m到麦克风i的房间冲击响应,gi(t)代表目标语音到麦克风i的房间冲击响应,ui(t)代表系统白噪声和环境噪声,“*”代表卷积运算;2CN105957536A权利要求书2/4页步骤10、参考信号r1(t),r2(t),...,rM(t)写缓冲区,缓冲区大小为M个1024B,其中每一个参考信号通道为1024个浮点数据;步骤11、对每一个通道数据进行加窗傅里叶变换,窗函数w(t)为1024长度的汉明窗,T=1024:式(2)中,l和k分别代表时间帧和频带;步骤12、对每一个频带,当前帧及前L帧组成向量:式(3)中上标“T”代表转置算子;步骤13、假设从第一帧开始,一直到第lS=50帧,一直没有目标语音,迭代更新参考信号的自相关矩阵:式(4)中,α为平滑因子,上标‘H’代表共轭转置算子;即重复步骤10至步骤13,直至lS=50,再进行步骤14;步骤14、每一个频带k,计算其自相关矩阵的特征值分解:式(5)中,ΡR,k是特征向量构成的矩阵,为特征值构成的对角矩阵,特征值与特征向量一一对应;步骤15、对特征值进行降序排列,构造各通道聚合度评估函数:步骤16、根据如下准则评估聚合度及冗余信息:J(I)>0.95,J(I-1)<0.95,(7)即只保留前I个特征向量所构成的自相关矩阵,剩余信息作为冗余信息;步骤17、选择前I个特征值对应的特征向量构造新的自相关矩阵:3.如权利要求1所述的基于通道聚合度频域回声消除方法,其特征在于,所述步骤2还包括行Double-Talk监测步骤,监测准则如下所示:如果ψi(l)>3则表示目标语音为0,不属于Double-Talk情况;否则,目标语音不为0,判断为Double-Talk情况;如果为Double-Talk时间帧,计算语音扭曲控制因子:3CN105957536A权利要求书3/4页更新目标语音估计如下:4.如权利要求1所述的基于通道聚合度频域回声消除方法,其特征在于,所