预览加载中,请您耐心等待几秒...
1/8
2/8
3/8
4/8
5/8
6/8
7/8
8/8

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114299383A(43)申请公布日2022.04.08(21)申请号202111471860.X(22)申请日2021.12.03(71)申请人河海大学地址210024江苏省南京市鼓楼区西康路一号(72)发明人娄渊胜童雪帅(51)Int.Cl.G06V20/10(2022.01)G06V10/25(2022.01)G06V10/26(2022.01)G06V10/774(2022.01)G06V10/80(2022.01)G06V10/82(2022.01)G06K9/62(2022.01)G06N3/04(2006.01)权利要求书1页说明书5页附图1页(54)发明名称基于密度图与注意力机制融合的遥感图像目标检测方法(57)摘要基于密度图与注意力机制融合的遥感图像目标检测方法。本发明主要基于密度图切割的思想,通过物体的稀疏或密集的分布情况,指导图像进行前景与背景的分割,尽可能减少目标检测中对于背景部分的计算,降低复杂背景对于小目标检测的影响,结合注意力机制,通过网络中的通道注意力机制过滤冗余矛盾的背景信息。使用空间注意力机制,更加关注图像中的目标区域,并抑制了非目标区域或背景区域。采用改进的FPN金字塔网络进行目标检测的多尺度特征提取,融合低层特征高分辨率和高层特征的高语义信息,用Soft‑NMS替换NMS,减少误检率。最后采用FasterR‑CNN二级检测器进行目标检测,生成目标类别及位置回归,最终达到提升小目标检测精度的目的。CN114299383ACN114299383A权利要求书1/1页1.基于密度图与注意力机制融合的遥感图像目标检测方法,其特征在于,包括如下步骤:步骤1:输入遥感图像,根据图像中物体的分布生成密度图并进行图片分割。步骤2:将分割后的图片通过ImageNet数据集上预先训练的Resnet101进行自下而上的特征提取。步骤3:采用改进的FPN特征金字塔通过横向连接分别连接Resnet101的特征层,自下至上的不同维度特征生成,自上至下的特征补充增强,低层特征图包含更多的位置信息,有利于定位的实现,而高层特征图包含更多的语义信息,更有利于分类的实现。步骤4:引入注意力机制模块,水平连接FPN各特征层,在不引入过多参数的情况下获得较好的语义信息捕获能力。注意力机制模块包括跨通道注意块和坐标注意块,由两个注意块获得的权值乘以原始特征图。将两个特征图相加后,得到去噪网络。步骤5:通过FPN的特征层,区域生成网络在每个尺度上根据预测中心点坐标和宽、高生成候选区域(x,y,w,h),x,y,w,h分别代表中心点的横坐标,纵坐标,宽和高;将候选区域进行池化操作,进一步提取降维后的候选区域特征,作为全连接层分类的输入。步骤6:用Soft‑NMS替换NMS,减少误检率。使用Soft‑NMS进行交并比数据后处理,使用高斯加权函数找出最佳锚框;其中,Si代表bi的得分,M是当前得分最高的锚框,bi是要处理的锚框。D代表最终检测锚框集,IOU表示交并比,即检测锚框与地真值的重叠率。fIOU(M,bi)是M和bi之间的交并比。fIOU(M,bi)越大,Si下降的越严重。步骤7:将池化特征输入全连接层,输出目标的位置以及通过Softmax输出目标分类,通过平均精度(AP)和类平均精度(mAP)对目标的检测的性能进行评估。首先定义精度和召回率:其中,当锚框与真实区域的面积交比大于0.7时,认为锚框是正确检测的目标框(TP),否则认为是错误检测的目标框(FP)。此外,如果该区域多个锚框和真正的区域面积的交并比大于0.7,只有面积最大的矩形框架交叉比率将被视为正确检测到目标框架(TP),其他矩形帧被认为是一个错误的检测帧(FP)。FN表示被错误判断为错误检测锚框的正确检测锚框的数量。设置步长为0.1,并在recall=[0,0.1,0.2,...,1]时取相应的精度值。这些精度值的平均值为AP。mAP是计算所有类的AP的平均值。最终得到预测目标类别和坐标回归的精度。2CN114299383A说明书1/5页基于密度图与注意力机制融合的遥感图像目标检测方法技术领域[0001]本发明属于计算机视觉技术领域,具体涉及基于密度图与注意力机制融合的遥感图像目标检测方法。背景技术[0002]到目前为止,目标检测是计算机视觉领域中一项基本而艰巨的任务。现有的检测方法可以分为基于模板匹配的方法,基于知识的方法,基于对象图像分析的方法和基于机器学习的方法四大类。深度学习算法是目前流行的一种新型计算模型,与传统的对象检测和定位方法相比,基于深度学习的方法具有更强的泛化能力和特征表达能力。但是,过大的图像,复杂的图像背景以及训练样本的大小和数量分布不均,使得检测任务更具挑战性。[