预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114140665A(43)申请公布日2022.03.04(21)申请号202111474306.7(22)申请日2021.12.06(71)申请人广西师范大学地址541004广西壮族自治区桂林市育才路15号(72)发明人陆声链刘晓宇李帼陈明(74)专利代理机构桂林市华杰专利商标事务所有限责任公司45112代理人陶平英(51)Int.Cl.G06V10/774(2022.01)G06V10/80(2022.01)G06K9/62(2022.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书5页附图7页(54)发明名称一种基于改进YOLOv5的密集小目标检测方法(57)摘要本发明公开了一种基于改进YOLOv5算法的密集小目标检测方法,该方法对YOLOv5算法做出了进一步的改进。其思想为(1)在YOLOv5骨干提取网络中添加协调注意力机制(CA),通过把位置信息嵌入到通道注意力,从而使移动网络获得更大区域的信息而避免引入大的开销;(2)在YOLOv5的特征融合网络中,使用BiFPN代替PANet,引入权重,更好的平衡不同尺度的特征信息;(3)针对密集、相互遮挡的小目标,使用VarifocalLoss来训练密集目标,使得网络模型面对大面积聚簇重叠的目标时,能够准确识别。对物体自身现状颜色变化、复杂自然环境条件等也有较好的鲁棒性。CN114140665ACN114140665A权利要求书1/2页1.一种基于改进YOLOv5算法的密集小目标检测方法,其特征在于,包括如下步骤:S1、图像的获取:用户利用图像采集设备对目标对象进行图像采集,并将采集到的图像按照PascalVOC数据集的格式将图片命名,同时创建名为Annotations、ImageSets、JPEGImages的三个文件夹;S2、图像预处理:S2‑1、图像标记:在步骤S1采集到的图像中,运用图像标注工具LabelImg对图像中的目标进行标记,标注出目标的位置、类别名称;S2‑2、图像扩增:若步骤S1用户采集到的图像不能达到识别单个类别目标所需2000张图片的要求,则运用Augmentor图像数据增强库对图像进行扩增,用户选定图像的保存路径和标记信息XML文件路径,并制定扩增后的图像及XML文件输出路径,选择所需的图像增强器,选择扩增数量以及扩增方式对图像进行扩增,达到识别所需要求;S2‑3、划分数据集:将扩增得到的图像和标记文件划分成训练集、测试集、验证集和训练验证集,训练集、测试集、验证集分别占50%、25%、25%,训练验证集为训练集与验证集的累加,占75%;S3、设置网络模型参数:在YOLOv5网络模型的配置文件yaml中,根据计算机内存、显存的大小,用户所需的识别效果和训练速度,设置卷积神经网络输入图像的尺寸、识别种类的数量、迭代次数;且用户需使用支持CUDA加速的显卡类型;S3‑1、当选择输入网络的图像尺寸为608*608,batch参数为8,迭代次数epcoh为300,检测物体种类为2时,用户使用单GPU训练模型,至少需要6GB;S3‑2、当选择输入网络的图像尺寸为640*640,batch参数为8,迭代次数epcoh为300,检测物体种类为2时,用户使用单GPU训练模型,至少需要8GB;S4、对原YOLOv5网络结构进行改进,得到改进后的YOLOv5网络结构,改进过程如下:S4‑1:在原YOLOv5网络结构中,在第3、6和9层后添加CA协调注意力机制,利用两个1D全局池化操作将沿垂直和水平方向的输入特征分别聚合为两个单独的位置感知;然后将具有嵌入的特定方向信息的这两个特征图分别编码为两个attentionmap,每个attentionmap都沿一个空间方向捕获输入特征图的远距离依存关系,位置信息被保存在所生成的attentionmap中;在通过乘法将两个attentionmap都应用于输入特征图,以强调注意区域的表示;S4‑2:在原YOLOv5网络结构中,使用加强特征提取BiFPN,在PANet简化版的基础上,若输入和输出结点是同一层的,则添加一条额外的边,在不增加cost的同时融合更多的特征;对P5_in进行上采样,上采样后与P4_in进行Concat_bifpn堆叠获得P4_td;之后对P4_td进行上采样,上采样后与P3_in进行Concat_bifpn堆叠获得P3_out;之后对P3_out进行下采样,下采样后与P4进行Concat_bifpn堆叠获得P4_out;之后对P4_out进行下采样,下采样后与P5_in进行堆叠获得P3_out;S4‑3:使用VarifocalLoss进行损失函数的计算,解决类不平衡问题,其中p是预测的Io