预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113673593A(43)申请公布日2021.11.19(21)申请号202110941462.3(22)申请日2021.08.17(71)申请人辽宁工程技术大学地址123000辽宁省阜新市细河区中华路47号(72)发明人曲海成夏明豪(74)专利代理机构北京华夏正合知识产权代理事务所(普通合伙)11017代理人韩登营张丽萍(51)Int.Cl.G06K9/62(2006.01)G06K9/46(2006.01)G06K9/00(2006.01)权利要求书1页说明书4页附图1页(54)发明名称一种基于注意力机制的多尺度特征融合行人检测方法(57)摘要本发明公开了一种基于注意力机制的多尺度特征融合行人检测方法,包括:输入训练集和验证集,提取行人特征并生成特征图;输入网络模型,训练模型;是否达到指定批次,若是则输出模型并验证模型。本发明的基于注意力机制的多尺度特征融合行人检测方法将FCOS算法应用到行人检测中,在其基础上采用了密集金字塔结构,将顶层特征与底层特征进行融合,这样能够使融合后的特征具有底层的空间信息和顶层特征的细节信息,能够更好的识别出行人目标。其次,在融合后的特征融入空间和通道注意力,使其能够更精准的定位到行人目标。CN113673593ACN113673593A权利要求书1/1页1.一种基于注意力机制的多尺度特征融合行人检测方法,其特征在于,包括以下步骤:步骤1:输入训练集和验证集,提取行人特征并生成特征图;步骤2:输入网络模型,训练模型;步骤3:是否达到指定批次,若是则输出模型并验证模型。2.如权利要求1所述的基于注意力机制的多尺度特征融合行人检测方法,其特征在于,在步骤1中,将输入的特征图通过通道注意力模块计算得到唯一的通道注意力图,再将输入的特征图与通道注意力图经过像素级相乘后得出显著特征图;然后通过空间注意力模块计算得到二维的空间注意力图,最后显著特征图与空间注意力图的像素级相乘后输出最终的显著特征图。3.如权利要求2所述的基于注意力机制的多尺度特征融合行人检测方法,其特征在于,通道注意力首先对特征图分别使用最大池化和平均池化,分别生成两个不同的空间内容描述特征图,将这两个空间内容描述特征图同时送入一个共享网络计算得到通道注意力图,最后使用按点像素逐位相加的方式将共享网络的输出向量融合得到。2CN113673593A说明书1/4页一种基于注意力机制的多尺度特征融合行人检测方法技术领域[0001]本发明属于行人检测的技术领域,尤其涉及一种基于注意力机制的多尺度特征融合行人检测方法。背景技术[0002]二十一世纪中国的科学发展力突飞猛进,已经为人们的日常生活提供了相当大的便捷。越来越多繁琐的工作都可以通过计算机完成,而不是每一项任务、工作都需要人们着手、亲历亲为;在过去,每项工作都是以人力为基础,比如农耕,这样既浪费时间、财力又会消耗大量的人力、物力。然而如今,因为有了计算机大数据的存在,在得到有质量结果的同时,同样又不占用公共资源,节省了大量的时间。计算机视觉就是大势所趋研究者急需研究的课题领域,它应用了模式识别、图像处理和机器学习等多个学科。[0003]由于一阶全卷积网络(FCOS)实现了无提议、无锚框的思想,并且提出了中心度的思想,其可以降低远离中心的边界框的权重,从而抑制低质量的边界框,提高检测质量。因此成为了进行行人检测的一种常用模型。随着行人检测技术的飞速发展,为了能够更好的检测行人、更好的学习模型的性能,将密集金字塔结构和注意力机制加入现有的各种网络结构中显示出了极大的改进潜力。[0004]CNN的作用是提取图像的在各个分辨率下的特征信息,低层的特征具有丰富的空间信息,适合检测小目标。相反顶层特征具有丰富的语义信息,适合检测大目标。因此本发明在CNN阶段将特征金字塔改为密集连接,这样使得融合后的特征具有更强的语义信息和空间信息。另外有效的注意力机制是提升模型对行人检测精度的关键。现有的单一注意机制应用在模型上有时候不会起到很好的作用,这就需要使用CBAM模块,这是一个简单而有效的前馈卷积神经网络注意力模块,它可以无缝集成到任何CNN架构中。因此将空间和通道注意力应用于深度神经网络的技术,对FCOS模型进行性能上的优化,是一项很有意义的研究。[0005]袁培江等2019年提出一种小尺度密集行人的检测方法,通过设置不同比例的长宽比,使其与行人的真实框计算交并比,小于0.3标记为负样本,大于0.7标记为正样本。从网络模型的不同阶段获取不同语义的特征图,取其中的3个阶段的特征图,将不同语义的特征图匹配不同尺度的目标,高语义特征图匹配大尺度目标,中语义特征图匹配中尺度目标,低语义特征图匹配小尺度目标,同时在不同语义特征图间采用级联