预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115937710A(43)申请公布日2023.04.07(21)申请号202211187837.2(22)申请日2022.09.28(71)申请人江苏中科梦兰电子科技有限公司地址215500江苏省苏州市常熟市琴川街道梦兰村申请人南京航空航天大学(72)发明人朱隆熙刘宁钟吴磊王淑君(74)专利代理机构南京锐恒专利代理事务所(普通合伙)32506专利代理师陈思(51)Int.Cl.G06V20/17(2022.01)G06N3/0464(2023.01)G06N3/08(2023.01)G06V10/82(2022.01)权利要求书2页说明书5页附图5页(54)发明名称一种基于无锚航拍图像旋转目标检测方法(57)摘要本发明公开了一种基于无锚航拍图像旋转目标检测方法,属于计算机视觉技术领域,该方法解决了目前航拍图像下目标识别准确度低的问题,在通用数据集DOTA‑v1上的检测精度达到了74.2。包括以下步骤:首先采集航拍图像,并对其中的目标进行标注,在标注的时候,本发明使用旋转目标标注的方法;之后在FCOS网络的基础上加上旋转角度信息,并且使用新的损失函数以及新的样本分配策略,构造新的网络结构;将航拍图像数据集送入到神经网络进行训练,直至网络收敛;然后利用训练好的神经网络和权重文件来检测测试图像中的车目标并输出检测结果。本发明能够很好地提高航拍图像下车辆检测的准确率。CN115937710ACN115937710A权利要求书1/2页1.一种基于无锚航拍图像旋转目标检测方法,其特征在于,所述方法包括以下步骤:步骤1:数据集获取过程;使用公共数据集DOTA数据集,将数据集按照1024×1024的大小进行裁剪得到可以用于训练的数据集;步骤2:构建神经网络过程;使用FCOS作为基准网络,并且在回归的内容中添加角度的信息,并且使用新的回归损失函数以及长宽比损失函数,并且针对不同的样本分配不同的权重进行训练;步骤3:神经网络训练过程;将裁剪后的通用数据集DOTA送入上述步骤2构建的卷积神经网络进行训练,直至网络收敛;步骤4:测试图像检测过程;采用训练好的神经网络和权重文件来检测测试图像中的目标,计算相关测试指标来判断网络的检测效果。2.根据权利要求1所述的一种基于无锚航拍图像旋转目标检测方法,其特征在于,所述步骤1包括以下步骤:步骤2‑1:使用的数据集是DOTA数据集,所述数据集包含了268张来自不同传感器和平台的航拍影视图像,每张图像的大小在4000×4000的像素内,一共包含15个类别即飞机、舰船、储罐、棒球场、网球场、篮球场、田径场、海港、桥梁、大型车辆、小型车辆、直升机、环岛、足球场、游泳池,以及188282个检测实例,其中每个目标都使用OBB旋转带角度信息的标注方式;步骤2‑2:对数据集的图像进行裁剪和扩充的操作,使得每张图像的大小都为1024×1024像素的大小;步骤2‑3:设置1/2的数据集为训练集,1/3的数据集为验证集,1/6的数据集为测试集。3.根据权利要求1所述的一种基于无锚航拍图像旋转目标检测方法,其特征在于,所述步骤2包括以下步骤:步骤3‑1:使用ResNet50作为主干网络提取特征,使用该网络C3,C4,C5层的输出,将每个输出的通道数压缩到256方便接下来的操作;步骤3‑2:首先将P5特征图进行下采样操作得到P6,对P6特征图也进行下采样操作得到P7特征图用来检测大目标,对P5特征图进行上采样操作和C4特征图进行特征融合得到P4特征图,然后将P4特征图进行上采样操作和C3特征图进行特征融合得到P3特征图;步骤3‑3:将P3到P7的特征图送入到检测头当中,检测头有三个分支,一个分支用来分类,一个分支用来回归,还有一个分支用来回归角度,还有一个中心度分支,该分支与回归分支平行,中心度分支用来抑制远离中心点的低质量的预测框,回归分支用来预测每个特征点对应的l,r,t,b四个值,分别表示像素点到左边,右边,上边,下边的距离;步骤3‑4:使用Focalloss损失函数作为分类损失函数,中心度损失函数使用二维交叉熵损失函数,还使用长宽比损失函数来增加网络对检测框长宽比的监督。4.根据权利要求1所述的一种基于无锚航拍图像旋转目标检测方法,其特征在于,所述步骤3包括以下步骤:步骤4‑1:使用ResNet50作为主干网络,使用SGD梯度算法,训练了36个epoch,起始学习2CN115937710A权利要求书2/2页率设为0.01,并且在30,33的时候分别下降为原来的十分之一,设置每个batch‑size的大小为4,并且将每张图片resize到1024×1024来进行训练;步骤4‑2:在神经网络上尝试不同的训练超参数,进行训练,得到可用于航拍图像检测的网络文件和权重文