预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115376125A(43)申请公布日2022.11.22(21)申请号202211173171.5(22)申请日2022.09.26(71)申请人安徽农业大学地址230036安徽省合肥市长江西路130号(72)发明人饶元束雅丽罗庆金秀江朝晖张武张筱丹(74)专利代理机构安徽知问律师事务所34134专利代理师代群群(51)Int.Cl.G06V20/68(2022.01)G06V10/24(2022.01)G06V10/40(2022.01)G06V10/764(2022.01)G06V10/80(2022.01)A01D46/30(2006.01)权利要求书3页说明书13页附图5页(54)发明名称一种基于多模态数据融合的目标检测方法以及基于目标检测模型的在体果实采摘方法(57)摘要本发明公开了一种基于多模态数据融合的目标检测方法以及基于目标检测模型的在体果实采摘方法,属于智能检测技术领域。一方面目标检测模型的训练方法中,利用深度相机获取自然环境下在体果实的多模态视觉数据,引入坐标注意力机制增强特征提取网络对目标物的感知能力,结合深度可分离卷积模块减少模型参数量和推理时间;另一方面将目标检测模型应用到机械臂对果实的识别中,提出基于果实位置信息和遮挡状态分类的视觉伺服检测机制,该机制利用机械臂在果实采摘过程中具有运动特性的优势,通过机械臂运动带动相机视角变化,不断更新相机视野内所检测到的果实目标,实现对果实的动态检测,克服因光照和果实遮挡造成的漏检,提高果实的检出率。CN115376125ACN115376125A权利要求书1/3页1.一种基于多模态数据融合的目标检测方法,其特征在于,包括以下步骤:S110:构建基于多模态数据融合的目标检测模型,所述目标检测模型包括特征提取网络、颈部结构和预测层,在所述特征提取网络中和颈部结构均引入坐标注意力机制增强对目标物感知能力,其中所述多模态视觉数据包含RGB图像、红外图像和深度图像的多模态视觉数据;S120:获取在体目标物的多模态视觉数据作为训练集,并输入所述目标检测模型进行训练,得到训练好的目标检测模型;S130:获取待测多模态视觉数据,所述待测多模态视觉数据包含待采摘的目标物;将所述待测多模态视觉数据输入目标检测模型对多模态视觉数据中目标物进行识别,输出识别结果。2.根据权利要求1中所述的一种基于多模态数据融合的目标检测方法,其特征在于,在所述特征提取网络中和颈部结构均引入坐标注意力机制增强对目标物感知能力包括:在所述特征提取网络中嵌入坐标注意力模块,在所述颈部结构的末端嵌入坐标注意力模块。3.根据权利要求2中所述的一种基于多模态数据融合的目标检测方法,其特征在于,所述目标检测模型采用YOLOv5s模型,所述YOLOv5s模型中特征提取网络采用深度可分离卷积替换CBL模块中的普通卷积形成DPBL模块,在CSP_1_X模块级联操作后嵌入坐标注意力模块;所述颈部结构包括DBPL模块和CSP_2_X模块,CSP_2_X模块由普通卷积和X个Resunit级联而成,在所述颈部结构的末端嵌入坐标注意力模块;将特征提取网络的Focus模块结构的通道数调整为五通道以实现多模态视觉数据的读取。4.根据权利要求1中所述的一种基于多模态数据融合的目标检测方法,其特征在于,所述步骤S120包括:配置目标检测模型训练关键参数,所述关键参数包括输入图像的尺寸、类别数、训练迭代次数、初始学习率、学习率调整策略和每批处理的输入图像数量;采用CIOULoss作为边界框损失函数,训练至所述目标检测模型收敛,保存每个训练迭代次数训练结束后得到的权重文件,保存验证效果最好的权重文件,从而得到训练好的目标检测模型。5.一种基于目标检测模型的在体果实采摘方法,其特征在于,包括以下步骤:S210:根据权利要求1‑4任意一项所述的一种基于多模态数据融合的目标检测方法得到识别结果,所述识别结果包括目标物的多个分类标记和边界框坐标,所述分类标记包括未被遮挡、被无影响物遮挡和被有影响物遮挡三类;S220:随机选择一个遮挡形式为未被遮挡或被无影响物遮挡的目标物作为采摘对象,获取所述采摘对象的边界框坐标相对于所述深度相机的第一空间位置坐标;将所述采摘对象相对于所述深度相机的空间位置坐标转换为机械臂基底位置坐标信息;S230:获取所述原始机械臂位置信息,控制机械臂运动到指定的第一空间位置,用于对所述采摘对象进行采摘作业;根据多组采摘环境图像中目标物的识别结果和定位结果,结合对应的机械臂位置信息计算出机械臂下一运动起点;S240:重复上述S210至S230,直到机械臂所带深度相机的视野中不存在可采摘对象,采2CN115376125A权利要求书2/3页摘作业完成。6.根据权利要求5中