一种基于多模态数据融合的目标检测方法以及基于目标检测模型的在体果实采摘方法-豆柴文库

一种基于多模态数据融合的目标检测方法以及基于目标检测模型的在体果实采摘方法.pdf

2023-06-28

10金币

1.2MB

22页

书生****写意

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共22页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115376125A(43)申请公布日2022.11.22(21)申请号202211173171.5(22)申请日2022.09.26(71)申请人安徽农业大学地址230036安徽省合肥市长江西路130号(72)发明人饶元束雅丽罗庆金秀江朝晖张武张筱丹(74)专利代理机构安徽知问律师事务所34134专利代理师代群群(51)Int.Cl.G06V20/68(2022.01)G06V10/24(2022.01)G06V10/40(2022.01)G06V10/764(2022.01)G06V10/80(2022.01)A01D46/30(2006.01)权利要求书3页说明书13页附图5页(54)发明名称一种基于多模态数据融合的目标检测方法以及基于目标检测模型的在体果实采摘方法(57)摘要本发明公开了一种基于多模态数据融合的目标检测方法以及基于目标检测模型的在体果实采摘方法，属于智能检测技术领域。一方面目标检测模型的训练方法中，利用深度相机获取自然环境下在体果实的多模态视觉数据，引入坐标注意力机制增强特征提取网络对目标物的感知能力，结合深度可分离卷积模块减少模型参数量和推理时间；另一方面将目标检测模型应用到机械臂对果实的识别中，提出基于果实位置信息和遮挡状态分类的视觉伺服检测机制，该机制利用机械臂在果实采摘过程中具有运动特性的优势，通过机械臂运动带动相机视角变化，不断更新相机视野内所检测到的果实目标，实现对果实的动态检测，克服因光照和果实遮挡造成的漏检，提高果实的检出率。CN115376125ACN115376125A权利要求书1/3页1.一种基于多模态数据融合的目标检测方法，其特征在于，包括以下步骤：S110：构建基于多模态数据融合的目标检测模型，所述目标检测模型包括特征提取网络、颈部结构和预测层，在所述特征提取网络中和颈部结构均引入坐标注意力机制增强对目标物感知能力，其中所述多模态视觉数据包含RGB图像、红外图像和深度图像的多模态视觉数据；S120：获取在体目标物的多模态视觉数据作为训练集，并输入所述目标检测模型进行训练，得到训练好的目标检测模型；S130：获取待测多模态视觉数据，所述待测多模态视觉数据包含待采摘的目标物；将所述待测多模态视觉数据输入目标检测模型对多模态视觉数据中目标物进行识别，输出识别结果。2.根据权利要求1中所述的一种基于多模态数据融合的目标检测方法，其特征在于，在所述特征提取网络中和颈部结构均引入坐标注意力机制增强对目标物感知能力包括：在所述特征提取网络中嵌入坐标注意力模块，在所述颈部结构的末端嵌入坐标注意力模块。3.根据权利要求2中所述的一种基于多模态数据融合的目标检测方法，其特征在于，所述目标检测模型采用YOLOv5s模型，所述YOLOv5s模型中特征提取网络采用深度可分离卷积替换CBL模块中的普通卷积形成DPBL模块，在CSP_1_X模块级联操作后嵌入坐标注意力模块；所述颈部结构包括DBPL模块和CSP_2_X模块，CSP_2_X模块由普通卷积和X个Resunit级联而成，在所述颈部结构的末端嵌入坐标注意力模块；将特征提取网络的Focus模块结构的通道数调整为五通道以实现多模态视觉数据的读取。4.根据权利要求1中所述的一种基于多模态数据融合的目标检测方法，其特征在于，所述步骤S120包括：配置目标检测模型训练关键参数，所述关键参数包括输入图像的尺寸、类别数、训练迭代次数、初始学习率、学习率调整策略和每批处理的输入图像数量；采用CIOULoss作为边界框损失函数，训练至所述目标检测模型收敛，保存每个训练迭代次数训练结束后得到的权重文件，保存验证效果最好的权重文件，从而得到训练好的目标检测模型。5.一种基于目标检测模型的在体果实采摘方法，其特征在于，包括以下步骤:S210：根据权利要求1‑4任意一项所述的一种基于多模态数据融合的目标检测方法得到识别结果，所述识别结果包括目标物的多个分类标记和边界框坐标，所述分类标记包括未被遮挡、被无影响物遮挡和被有影响物遮挡三类；S220：随机选择一个遮挡形式为未被遮挡或被无影响物遮挡的目标物作为采摘对象，获取所述采摘对象的边界框坐标相对于所述深度相机的第一空间位置坐标；将所述采摘对象相对于所述深度相机的空间位置坐标转换为机械臂基底位置坐标信息；S230：获取所述原始机械臂位置信息，控制机械臂运动到指定的第一空间位置，用于对所述采摘对象进行采摘作业；根据多组采摘环境图像中目标物的识别结果和定位结果，结合对应的机械臂位置信息计算出机械臂下一运动起点；S240：重复上述S210至S230，直到机械臂所带深度相机的视野中不存在可采摘对象，采2CN115376125A权利要求书2/3页摘作业完成。6.根据权利要求5中

相关资料

一种基于多模态数据融合的目标检测方法以及基于目标检测模型的在体果实采摘方法.pdf

本发明公开了一种基于多模态数据融合的目标检测方法以及基于目标检测模型的在体果实采摘方法，属于智能检测技术领域。一方面目标检测模型的训练方法中，利用深度相机获取自然环境下在体果实的多模态视觉数据，引入坐标注意力机制增强特征提取网络对目标物的感知能力，结合深度可分离卷积模块减少模型参数量和推理时间；另一方面将目标检测模型应用到机械臂对果实的识别中，提出基于果实位置信息和遮挡状态分类的视觉伺服检测机制，该机制利用机械臂在果实采摘过程中具有运动特性的优势，通过机械臂运动带动相机视角变化，不断更新相机视野内所检测到

2023-06-28

1.2MB

一种基于图像融合的多模态图像目标检测方法.pdf

本发明涉及一种基于图像融合的多模态图像目标检测方法，包括：1)将预先采集好的红外图像及其可见光图像，制作多模态图像数据集；2)将预处理好的成对图像作为融合模型中生成模型G的输入；生成模型G基于U‑Net等全卷积网络，以残差网络为基础的卷积神经网络作为生成网络模型结构，包括收缩过程和扩张过程，收缩路径包括多个卷积加ReLU激活层再加最大池化(MaxPooling)结构，下采样的每一步特征通道数都增加一倍，输出生成的融合图像；融合图像输入融合模型中的判别网络模型；根据训练过程中损失函数的变化，按迭代次数调节

2023-11-15

982KB

一种基于Transformer的跨模态融合目标检测方法.pdf

本发明涉及一种基于Transformer的跨模态融合目标检测方法，属于图像处理技术领域。本发明利用雷达传感器收集雷达数据同时摄像头收集图像数据。将毫米波雷达信息与图像信息进行对齐操作，包括时间对齐和空间坐标转换，同时将雷达特征映射到图像平面上。依据雷达物理特性对雷达信息进行预处理。构建特征提取网络，分别提取雷达特征和图像特征。设计雷达与视觉特征交互融合模块，充分考虑跨模态信息交互和上下文环境信息的补充学习。本发明与现有技术相比，将周围环境信息结合跨模态信息进行联合学习。解决了传统方法仅仅只能获取相同位置信

2023-07-22

600KB

一种基于四类多模态数据融合的目标多维度检测方法.pdf

本发明公开了一种基于四类多模态数据融合的目标多维度检测方法，包括：采集待检测目标的雷达点云图像、红外图像、磁场图像以及RGB图像，搭建卷积神经网络对四种输入图像进行特征提取，将预定义三维锚框投影到四种特征图上，搭建引入注意力模块的RPN网络生成建议框，将建议框投影到四种特征图上，搭建全连接网络实现边界框回归、方向估计和类别分类。本发明针对采用通常的RGB图像目标检测方法的缺陷，利用雷达、红外以及磁场图像可以弥补信息的缺失，提高对目标的检测精度。

2023-07-24

431KB

基于注意力机制的多模态数据融合三维目标检测方法.pdf

本发明提出了一种基于注意力机制的多模态数据融合三维目标检测方法，实现步骤为：建立训练和测试样本集并对数据进行预处理；构建基于注意力机制的多模态数据融合三维目标检测网络；定义基于注意力机制的多模态数据融合三维目标检测网络的损失函数；对网络模型进行迭代训练；获取三维目标的检测结果。本发明利用特征学习网络，初步提取出一些候选区域，然后将候选区域中的点云数据、点的位置特征以及对应的图像信息进行了融合，充分利用了点云的规则化空间位置信息、点特征的精细化空间结构信息和图像的语义信息，减小了误差累积，进而提高了局部空间

2023-07-21

520KB