预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115035354A(43)申请公布日2022.09.09(21)申请号202210964547.8G06V10/82(2022.01)(22)申请日2022.08.12G06V20/10(2022.01)(71)申请人江西省水利科学院地址330029江西省南昌市北京东路1038号申请人南昌工程学院(72)发明人许小华包学才王海菁曾祥君李德龙(74)专利代理机构南昌丰择知识产权代理事务所(普通合伙)36137专利代理师张荣(51)Int.Cl.G06V10/764(2022.01)G06V10/774(2022.01)G06V10/80(2022.01)权利要求书2页说明书6页附图4页(54)发明名称基于改进YOLOX的水库水面漂浮物目标检测方法(57)摘要本发明公开了一种基于改进YOLOX的水库水面漂浮物目标检测方法,其方法为:图像数据集收集和预处理操作;改进YOLOX算法模型,提出一种改进特征融合模块,增强输出特征信息的丰富度,提升大目标和小目标水库漂浮物的精度;判断是否要调整学习率以降低训练损失值,提升检测精度:若是,则在训练过程中手动更改超参数的取值并继续训练;否则,保持按原超参数训练;完成训练,获取最优权重:最后水库水面漂浮物图片检测识别。本发明的有益效果是:采用改进YOLOX算法模型进行目标检测,训练参数量适中,检测精度更好,实现了水库水面漂浮物的自动化高精度检测和识别。CN115035354ACN115035354A权利要求书1/2页1.基于改进YOLOX的水库水面漂浮物目标检测方法,其特征在于,包括步骤如下:S1、图像数据集收集和预处理操作:针对不同水库检测场景制作大量水面漂浮物的图像;将图像数据进行分类和筛选,剔除无效图像,得到数据集;保证每一类的数据集相同;利用图像预处理模块将水面漂浮物的图像进行尺寸变化以适应网络模型的输入,并对数据集进行标注,最后确定训练集、验证集和测试集;S2、改进YOLOX算法模型,具体改进如下:构建9层CSPLayer残差结构组成的dark2模块,即修改YOLOX主干网络,将原有1层的160*160*128的残差结构层CSPLayer改为9层,强化提取目标特征;提出一种改进特征融合模块,增强输出特征信息的丰富度,提升目标水库漂浮物的精度;S3、判断是否要调整学习率以降低训练损失值,提升检测精度:若是,则在训练过程中手动更改超参数的取值并继续训练;否则,保持按原超参数训练;S4、完成训练,获取最优权重:当训练和验证损失值均小于3%时,结束训练,保存当前权重作为最优权重;S5、水库水面漂浮物图片检测识别:利用基于最优权重的改进YOLOX算法模型对水库的水面进行检测,判断是否有水面漂浮物,如果有则确定漂浮物的具体位置、大小和置信度并进行输出。2.如权利要求1所述基于改进YOLOX的水库水面漂浮物目标检测方法,其特征在于,步骤S1具体过程如下:S1‑1,收集水库中常出现的垃圾漂浮物类别并针对不同场景水库获取具有水面漂浮物图片,收集完后进行筛选工作将无效图片进行剔除;将剔除后的图片整理成漂浮物数据集;S1‑2,采用VOC、COCO数据集相同的目标检测标记手法,通过数据集标记软件Labelimg标记已收集水面各类漂浮物数据集,默认使用矩形框进行标注,将“bottle”作为瓶子标识,“snakeBags”作为零食袋标识,“branch”作为树枝标识,“plasticBag”作为塑料袋标识;获得一组xml与相应jpg图片对应的标注集;S1‑3,确定训练集、验证集和测试集:根据标记完成的数据集数量以7:2:1的比例将数据集分为训练集、验证集和测试集,在训练过程中训练集和验证集不断对权重进行校正,以使得得到真实框GT的位置信息,将xml位置信息和对应图像的地址储存在一个.txt文件中,让改进YOLOX算法模型读取.txt文件进行训练。3.如权利要求1所述的基于改进YOLOX的水库水面漂浮物目标检测方法,其特征在于,步骤S2中提出一种改进特征融合模块的具体改进如下:在YOLOX的特征融合结构上,新增特征图大小为160*160*128的融合结构,并与修改主干网络中由9层大小为160*160*128CSPLayer残差结构组成的dark2模块输出相连;将新增特征图大小为160*160*128的融合结构与由主干网络中3层大小为80*80*256CSPLayer残差结构的输出做add操作,然后输出再与新增1层大小为80*80*256CSPLayer残差结构相连;将特征图大小80*80*256的融合结构与主干网络中3层大小为40*40*512CSPLayer残差结构的输出做add操作,然后输出再与新增1层大小为40*40*512CSPLayer残差结