一种基于Transformer的跨模态融合目标检测方法.pdf
猫巷****忠娟
在线预览结束,喜欢就下载吧,查找使用更方便
相关资料
一种基于Transformer的跨模态融合目标检测方法.pdf
本发明涉及一种基于Transformer的跨模态融合目标检测方法,属于图像处理技术领域。本发明利用雷达传感器收集雷达数据同时摄像头收集图像数据。将毫米波雷达信息与图像信息进行对齐操作,包括时间对齐和空间坐标转换,同时将雷达特征映射到图像平面上。依据雷达物理特性对雷达信息进行预处理。构建特征提取网络,分别提取雷达特征和图像特征。设计雷达与视觉特征交互融合模块,充分考虑跨模态信息交互和上下文环境信息的补充学习。本发明与现有技术相比,将周围环境信息结合跨模态信息进行联合学习。解决了传统方法仅仅只能获取相同位置信
一种基于多尺度transformer的多模态医学图像融合方法.pdf
本发明公开了一种基于多尺度transformer的多模态医学图像融合方法,属于医学图像融合技术领域。本发明提出了一种新型高效的融合模型,设计多尺度transformer模型引入特征提取网络,使得特征提取网络可以有效地提取多尺度深度特征,并为融合任务保留更多有意义的信息;在网络训练的过程中自适应感受野和patch大小,并构建基于结构相似性优化目标函数来约束图像生成质量;利用卷积计算结合Transformer,为医学影像融合结果提供了更好的视觉效果和量化结果。
一种基于图像融合的多模态图像目标检测方法.pdf
本发明涉及一种基于图像融合的多模态图像目标检测方法,包括:1)将预先采集好的红外图像及其可见光图像,制作多模态图像数据集;2)将预处理好的成对图像作为融合模型中生成模型G的输入;生成模型G基于U‑Net等全卷积网络,以残差网络为基础的卷积神经网络作为生成网络模型结构,包括收缩过程和扩张过程,收缩路径包括多个卷积加ReLU激活层再加最大池化(MaxPooling)结构,下采样的每一步特征通道数都增加一倍,输出生成的融合图像;融合图像输入融合模型中的判别网络模型;根据训练过程中损失函数的变化,按迭代次数调节
一种基于多模态数据融合的目标检测方法以及基于目标检测模型的在体果实采摘方法.pdf
本发明公开了一种基于多模态数据融合的目标检测方法以及基于目标检测模型的在体果实采摘方法,属于智能检测技术领域。一方面目标检测模型的训练方法中,利用深度相机获取自然环境下在体果实的多模态视觉数据,引入坐标注意力机制增强特征提取网络对目标物的感知能力,结合深度可分离卷积模块减少模型参数量和推理时间;另一方面将目标检测模型应用到机械臂对果实的识别中,提出基于果实位置信息和遮挡状态分类的视觉伺服检测机制,该机制利用机械臂在果实采摘过程中具有运动特性的优势,通过机械臂运动带动相机视角变化,不断更新相机视野内所检测到
一种基于双模态融合网络的目标检测方法及装置.pdf
本发明提供一种基于双模态融合网络的目标检测方法,包括获取图像对数据集,建立双模态图像数据集,构建模块分别对红外图像和可见光图像编码,构建双路门控融合网络,将融合特征输入至基准方法YOLOv5‑s网络第三层,得到最终检测网络,处理好的图像对数据集,输入至最终检测网络中,得到检测结果;还包括一种基于本发明方法的目标检测装置;本发明方法采用嵌入门控融合网络,使模型能够确定两种模态图像在不同场景中对检测的贡献;引入多任务学习的思想,自适应调节权重分配,实现跨模态特征融;面对黑夜等复杂环境本发明具有较好的鲁棒性。