预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN105575403A(43)申请公布日2016.05.11(21)申请号201510990289.0H04S1/00(2006.01)(2006.01)(22)申请日2015.12.25H04S7/00(71)申请人重庆邮电大学地址400065重庆市南岸区黄桷垭崇文路2号(72)发明人张毅徐晓东萧红罗久飞黄超苏祖强(74)专利代理机构重庆市恒信知识产权代理有限公司50102代理人刘小红(51)Int.Cl.G10L25/48(2013.01)G10L19/008(2013.01)G10L21/028(2013.01)权利要求书1页说明书7页附图1页(54)发明名称一种融合听觉掩蔽与双耳信号帧的互相关声源定位方法(57)摘要本发明请求保护一种融合听觉掩蔽与双耳信号帧的互相关声源定位方法,涉及语音识别控制领域。本发明在鲁棒性方面,针对传统基于双耳互相关的声源定位方法在噪声环境下声源定位精度下降,提出把听觉掩蔽的听觉特性引入谱减法中,能够较好地抑制音乐噪声,可以把基于听觉掩蔽的谱减法作为双耳定位的前端处理,这将有利于广义互相关提取双耳时间差,从而提高声源定位系统在噪声环境下的声源定位精度;在双耳互相关声源定位方法的改进上,针对“耳廓效应”和“优先效应”对声源定位的影响较大,提出基于双耳信号帧的互相关声源定位方法,该方法可以减少“耳廓效应”和“优先效应”所带来的定位误差,从而提高声源定位精度。CN105575403ACN105575403A权利要求书1/1页1.一种融合听觉掩蔽与双耳信号帧的互相关声源定位方法,其特征在于,包括以下步骤:101、建立基于双耳信号的声源定位模型,包括:扬声器、人工头、两个麦克风和一个用于信号处理的笔记本电脑,扬声器发出声音,人工头的耳道内的两个麦克风用于接收声源信号,并且将左耳和右耳的声音信号录取下来传输给笔记本电脑,笔记本电脑用于进行信号处理;102、麦克风获取语音信号,先对语音信号进行听觉掩蔽谱减法处理;103、然后采用基于双耳信号帧的声源定位方法对双耳信号进行分帧,再对每对信号帧采用双耳互相关声源定位方法计算,其次通过设定方位角度阈值,除去偏差较大的方位角度,获取声源方位角度。2.根据权利要求1所述的融合听觉掩蔽与双耳信号帧的互相关声源定位方法,其特征在于,步骤102听觉掩蔽谱减法具体为:在计算听觉掩蔽值之前,首先求得临界带宽的功率谱、扩展临界带宽的功率谱以及噪声掩蔽扩展门限,然后把噪声掩蔽扩展门限与人耳听觉的设定绝对门限值进行对比,听觉掩蔽阈值就是它们之中的最大值。3.根据权利要求2所述的融合听觉掩蔽与双耳信号帧的互相关声源定位方法,其特征在于,所述临界带宽的表达式如下:Z=26.18f/(1960+f)-0.53其中,Z表示临界带宽编号,f表示频率。4.根据权利要求3所述的融合听觉掩蔽与双耳信号帧的互相关声源定位方法,其特征在于,所述扩展临界带宽的功率谱在式中,P(k)为信号快速傅里叶变换的功率谱,li和hi分别表示第i个临界带宽的最小频率和最大频率,i在[1,imax]的范围内,并且语音信号的采样频率决定imax。5.根据权利要求3所述的融合听觉掩蔽与双耳信号帧的互相关声源定位方法,其特征在于,计算出噪声掩蔽阈值后,利用噪声掩蔽阈值和自适应的谱减法系数,得到两个谱减法系数,再结合Berouti提出的改进谱减法的方法,得到听觉掩蔽谱减法表达式。6.根据权利要求1所述的融合听觉掩蔽与双耳信号帧的互相关声源定位方法,其特征在于,步骤103具体为:假设左耳信号和右耳信号分别为:xl(t)和xr(t),经过分帧后成为长度相同的语音信号帧,令左耳信号xl(t)和右耳信号xr(t)在时间上相对应的语音信号帧分别为和然后,先对双耳信号进行时间延迟估计,利用广义互相关时延方法求出双耳时间差ITD,然后根据双耳时间差的几何模型,得到声源方向角度θk。7.根据权利要求6所述的融合听觉掩蔽与双耳信号帧的互相关声源定位方法,其特征在于,还包括过滤方位角度的步骤:设定一个过滤角度阈值,将误差大于过滤角度阈值的方位角度除去,把剩余方位角度的平均值作为最终声源定位的方位角度,求取剩余方位角度的平均值从而计算得到声源定位的方位角度。2CN105575403A说明书1/7页一种融合听觉掩蔽与双耳信号帧的互相关声源定位方法技术领域[0001]本发明属于双耳信号的声源定位领域,具体涉及声源定位系统中的抗噪和双耳互相关声源定位方法的改进。背景技术[0002]在现实生活中,人们的谈话场景通常存在多个声源、背景噪声以及回响,但是人耳听觉系统能够有效的识别和定位出感兴趣的声源信号,这种现象被称为“鸡尾酒会效应”。这种现象经常出现在鸡尾酒会上,两个客人可以在说话的一