预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115951305A(43)申请公布日2023.04.11(21)申请号202211654433.X(22)申请日2022.12.22(71)申请人四川启睿克科技有限公司地址610000四川省成都市中国(四川)自由贸易试验区成都高新区天府四街199号1栋33层(72)发明人王阳宣李俊潇李晓冬彭世伟(74)专利代理机构成都虹桥专利事务所(普通合伙)51124专利代理师吴中伟(51)Int.Cl.G01S5/20(2006.01)G06F17/14(2006.01)权利要求书1页说明书4页附图3页(54)发明名称一种基于SRP-PHAT空间谱和GCC的声源定位方法(57)摘要本发明涉及声源定位技术,其公开了一种基于SRP‑PHAT空间谱和GCC的声源定位方法,在减少计算量的同时,保证声源定位精度。该方法包括:S1、根据麦克风阵列结构中的麦克风采集到的观测信号,通过GCC算法计算其它麦克风和参考麦克风之间的时延;S2、根据麦克风阵列的几何结构,基于步骤S1计算的时延确定声源角度的范围;S3、利用SRP‑PHAT算法在步骤S2确定的声源角度的范围中进行搜索,确定出声源方向角。本发明利用了GCC声源定位算法计算量小,速度快的优势,先进行声源角度范围的确定,并结合了SRP‑PHAT空间谱算法精确度高的优势,直接在确定的声源角度范围内进行声源方向搜索,从而在减少计算量的同时,保证声源定位精度。CN115951305ACN115951305A权利要求书1/1页1.一种基于SRP‑PHAT空间谱和GCC的声源定位方法,其特征在于,该方法包括以下步骤:S1、根据麦克风阵列结构中的麦克风采集到的观测信号,通过GCC算法计算其它麦克风和参考麦克风之间的时延;S2、根据麦克风阵列的几何结构,基于步骤S1计算的时延确定声源角度的范围;S3、利用SRP‑PHAT算法在步骤S2确定的声源角度的范围中进行搜索,确定出声源方向角。2.如权利要求1所述的一种基于SRP‑PHAT空间谱和GCC的声源定位方法,其特征在于,步骤S1中,所述通过GCC算法计算其它麦克风和参考麦克风之间的时延,具体包括:首先,对两个麦克风的观测信号进行快速傅里叶变换;然后,对经过快速傅里叶变换后的两个信号进行共轭相乘并进行PHAT加权;最后,对经过PHAT加权的信号进行逆傅里叶变换获得广义互相关序列,所述广义互相关序列中的峰值对应的时延即为两个麦克风之间的信号时延。3.如权利要求1所述的一种基于SRP‑PHAT空间谱和GCC的声源定位方法,其特征在于,步骤S2中,根据麦克风阵列的几何结构,基于步骤S1计算的时延确定声源角度的范围,具体包括:假设步骤S1中计算出来的时延为T,则声源角度θ的范围为:其中,fs为采样频率,c为声速,L为麦克风阵元间的间距。4.如权利要求1所述的一种基于SRP‑PHAT空间谱和GCC的声源定位方法,其特征在于,步骤S3中,所述利用SRP‑PHAT算法在步骤S2确定的声源角度的范围中进行搜索,确定出声源方向角,具体包括:首先,对每个麦克风采集到的信号进行傅里叶变换;然后对不同频率的幅频根据扫描角度进行相位补偿;接着对所有麦克风的频域信号求和,获得相位补偿后的求和频域信号;最后,对所述相位补偿后的求和频域信号进行逆傅里叶变换,获得该角度下补偿后的时序信号,在步骤S2确定的声源角度范围中,将使补偿后的时序信号能量最大的角度确定为声源方向角。5.如权利要求1‑4任意一项所述的一种基于SRP‑PHAT空间谱和GCC的声源定位方法,其特征在于,所述麦克风阵列结构采用4麦线性麦克风阵列结构。2CN115951305A说明书1/4页一种基于SRP‑PHAT空间谱和GCC的声源定位方法技术领域[0001]本发明涉及声源定位技术,具体涉及一种基于SRP‑PHAT(SteerableResponsePower‑PhaseTransformation,可控响应功率相位变换)空间谱和GCC(GeneralizedCross‑Correlation,广义互相关)的声源定位方法。背景技术[0002]声源定位技术在语音识别、智能语音系统、人机交互的前端处理中以及视频会议、智能家居等领域都有着广泛的应用前景。传统的声源定位技术基于麦克风阵列技术,利用不同麦克风采集到的数据对声音的方向进行估计。常见的DOA算法有三种:[0003]1、基于声音的到达时延差(Timedelayofarrival,TDOA):由于阵列上每个阵元接受到的声源信号的延时的不同,我们可以通过广义互相关(GeneralizedCross‑Correlation,GCC)估计各个阵元之间的时延差,然后结合几何阵列关系来确定声源的方向。这类方法计算量小、抗噪能力强,但是