自动驾驶场景下基于改进faster-RCNN的小目标检测方法-豆柴文库

自动驾驶场景下基于改进faster-RCNN的小目标检测方法.pdf

2023-07-24

10金币

1.4MB

18页

雨巷****凝海

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共18页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114202743A(43)申请公布日2022.03.18(21)申请号202111061549.8G06K9/62(2022.01)(22)申请日2021.09.10G06N3/04(2006.01)G06N3/08(2006.01)(71)申请人湘潭大学地址411105湖南省湘潭市雨湖区羊牯塘27号(72)发明人周彦文思捷李云燕王冬丽(74)专利代理机构长沙市融智专利事务所(普通合伙)43114代理人欧阳迪奇(51)Int.Cl.G06V20/56(2022.01)G06V10/80(2022.01)G06V10/44(2022.01)G06V10/764(2022.01)G06V10/82(2022.01)权利要求书3页说明书8页附图6页(54)发明名称自动驾驶场景下基于改进faster-RCNN的小目标检测方法(57)摘要本发明属于深度学习及计算机视觉领域，具体涉及一种自动驾驶场景下基于改进faster‑RCNN的小目标检测方法。本发明选取ResNet‑50作为主干特征提取网络，首先引入可变形卷积思路对主干网进行改进，提高了卷积神经网络的变换建模能力；然后在主干网络最后两层添加空间注意力机制，能准确定位小目标，提高小目标检测的准确率并增强小目标的特征提取；同时引入特征金字塔结构，结合了自上而下和自下而上以及高低维之间的特征融合策略，从而实现了特征增强；最后利用Soft‑NMS去除冗余边框，得到最好的检测结果；并利用多尺寸训练和大尺度检测的增强方法，提高模型鲁棒性。CN114202743ACN114202743A权利要求书1/3页1.一种自动驾驶场景下基于改进faster‑RCNN的小目标检测方法，其特征在于，包括以下步骤：步骤1：在自动驾驶场景下所拍摄的照片中搜集与驾驶相关的目标数据，制作数据集；步骤2：搭建神经网络模型框架；所述的神经网络模型的框架基于Faster‑RCNN构成，包括主干特征提取网络、特征融合网络、区域建议网络和分类与回归网络；所述的主干特征提取网络采用ResNet‑50，并用可变形卷积V2代替ResNet‑50最后两层中的传统卷积，同时在最后两层中添加空间注意力机制；所述的特征融合网络将主干特征提取网络提取的特征图进行改进的特征金字塔融合后传入区域建议网络生成一系列建议框，对目标进行初步定位，然后将建议框统一至相同大小，经过分类与回归网络处理得到最终结果；步骤3：训练神经网络模型；采用多尺度训练的方法训练神经网络模型，通过预热学习率的方式，以二分类交叉熵和SmoothL1Loss作为分类损失函数和回归损失函数，并采用随机梯度下降法来优化损失函数；步骤4：将待识别的图片输入训练好的神经网络模型中，得到检测结果。2.根据权利要求1所述的一种自动驾驶场景下基于改进faster‑RCNN的小目标检测方法，其特征在于，所述的步骤1中，与驾驶相关的目标数据包括车辆、行人、交通信号灯和交通标志。3.根据权利要求1所述的一种自动驾驶场景下基于改进faster‑RCNN的小目标检测方法，其特征在于，所述的步骤2中，所述的可变形卷积V2计算公式为：其中y表示输出的特征图，w表示的是每个采样值的权重，pn是卷积输出位置p0对应所在的一个整数偏移，用来提供附近语义信息，x表示输入的特征图，Δpn为偏移量，R表示在输入的特征图上采样所使用的规则网格，R＝{(‑1,‑1),(‑1,0),...,(0,1),(1,1)}，Δmn表示每个偏移的采样点的权重，Δmn∈[0，1]。4.根据权利要求1所述的一种自动驾驶场景下基于改进faster‑RCNN的小目标检测方法，其特征在于，所述的步骤2中，空间注意力机制是使用全局平均池化和全局最大值池化对输入的特征图F进行压缩操作，对输入的特征图F分别在通道维度上做mean和max操作，然后将得到的两个特征图按通道维度拼接，再经过一个卷积操作，降维为1个通道，使得到的特征图在空间维度上与输入的特征图一致，最后经过sigmoid函数生成空间注意力特征Ms；其中空间注意力机制Ms(F)计算公式为：式中，σ表示Sigmoid函数，AvgPool(F)表示对输入的特征图进行平均池化，MaxPool(F)表示对输入的特征图进行最大池化，和分别代表全局平均池化和全局最大池化池化输出的特征，f7*7表示空间注意力机制中使用的7×7卷积核；所述的步骤2中添加空间注意力机制，是将上一层产生的特征图做一次卷积计算产生2CN114202743A权利要求书2/3页输入特征图F，F经过空间注意力模块后得到空间注意力特征Ms，将F与Ms进行逐元素乘法操作得到新的特征图F1，然后将F1与F进行相加操作，保留ResNet的残差模块，最后生成的特征图

相关资料

自动驾驶场景下基于改进faster-RCNN的小目标检测方法.pdf

本发明属于深度学习及计算机视觉领域，具体涉及一种自动驾驶场景下基于改进faster‑RCNN的小目标检测方法。本发明选取ResNet‑50作为主干特征提取网络，首先引入可变形卷积思路对主干网进行改进，提高了卷积神经网络的变换建模能力；然后在主干网络最后两层添加空间注意力机制，能准确定位小目标，提高小目标检测的准确率并增强小目标的特征提取；同时引入特征金字塔结构，结合了自上而下和自下而上以及高低维之间的特征融合策略，从而实现了特征增强；最后利用Soft‑NMS去除冗余边框，得到最好的检测结果；并利用多尺寸训

2023-07-24

1.4MB

一种基于特征增强的复杂场景下小目标检测方法.pdf

本发明属于计算机视觉和目标检测领域，具体涉及一种基于特征增强的复杂场景下小目标检测方法。本发明的技术方案是：首先提出Cutout‑DA数据增强方法，生成新的遮挡数据扩充至VisDrone2021数据集中，然后设计多尺度融合的特征增强路径聚合网络MSFE‑PANet，通过集成注意机制、特征融合以及针对小目标的网络预测尺度策略，获取到更丰富、细致的语义信息特征和空间信息特征，设计预测框排斥损失函数RB_Loss，最后训练模型。本发明可以增强深层特征图的强定位信息与浅层特征图的强语义信息相互融合，帮助网络在复杂

2023-07-21

1.1MB

基于改进YOLOX模型的小目标检测方法.pdf

本发明涉及一种基于改进YOLOX模型的小目标检测方法。通过获取待检测图像，对待检测图像进行特征提取，得到多个初始特征，并将多个初始特征进行跨层特征融合，得到多个融合特征，根据多个融合特征的预测处理结果，得到针对该待检测图像的小目标检测结果。通过多层特征提取和跨层特征融合，使得小目标的浅层特征和深层特征相互融合处理，加强小目标特征提取效果，避免小目标特征丢失，提高对图像中小目标的检测效果。

2023-07-21

1.2MB

一种针对工业场景基于改进YOLOv4的小目标检测方法.pdf

本发明公开了一种针对工业场景基于改进YOLOv4的小目标检测方法，包括以下步骤：通过工业摄像头采集现场数据集；对采集数据集进行标注，划分训练集和测试集；通过K‑Means++聚类算法，对数据集中真实目标框计算出针对本数据集的不同大小的先验框大小；对YOLOv4模型中网络进行修改，得到YOLOv4‑head2网络模型；将训练集输入YOLOv4‑head2模型训练，并使用验证集不断优化模型效果；在YOLOv4的特征融合层，添加与低特征层的特征融合，得到YOLOv4‑head2‑L网络结构；将评价较高的模型经过

2023-11-08

420KB

一种基于改进的FasterRCNN的棕榈树检测和计算方法.pdf

本发明提供一种快速检测，检测精确率高的基于改进的FasterRCNN的棕榈树检测和计算方法。包括以下步骤，获取棕榈树种植园的高分辨率图像；根据高分辨率图像制作数据集，并把数据集拆分为训练数据集和测试数据集；得到的训练数据集进行标记；基于改进FasterRCNN算法，构建目标检测算法框架；利用目标检测算法框架，对标记的训练数据集进行训练，得到训练好的检测算法框架；将待检测的棕榈树数目的高分辨率图像输入到训练好的检测算法框架中进行检测并计算得到的棕榈树数目。

2023-07-24

615KB