一种基于四类多模态数据融合的目标多维度检测方法.pdf
书生****瑞梦
在线预览结束,喜欢就下载吧,查找使用更方便
相关资料
一种基于四类多模态数据融合的目标多维度检测方法.pdf
本发明公开了一种基于四类多模态数据融合的目标多维度检测方法,包括:采集待检测目标的雷达点云图像、红外图像、磁场图像以及RGB图像,搭建卷积神经网络对四种输入图像进行特征提取,将预定义三维锚框投影到四种特征图上,搭建引入注意力模块的RPN网络生成建议框,将建议框投影到四种特征图上,搭建全连接网络实现边界框回归、方向估计和类别分类。本发明针对采用通常的RGB图像目标检测方法的缺陷,利用雷达、红外以及磁场图像可以弥补信息的缺失,提高对目标的检测精度。
一种基于多模态数据融合的目标检测方法以及基于目标检测模型的在体果实采摘方法.pdf
本发明公开了一种基于多模态数据融合的目标检测方法以及基于目标检测模型的在体果实采摘方法,属于智能检测技术领域。一方面目标检测模型的训练方法中,利用深度相机获取自然环境下在体果实的多模态视觉数据,引入坐标注意力机制增强特征提取网络对目标物的感知能力,结合深度可分离卷积模块减少模型参数量和推理时间;另一方面将目标检测模型应用到机械臂对果实的识别中,提出基于果实位置信息和遮挡状态分类的视觉伺服检测机制,该机制利用机械臂在果实采摘过程中具有运动特性的优势,通过机械臂运动带动相机视角变化,不断更新相机视野内所检测到
一种基于图文交互的多模态数据融合方法.pdf
本发明公开了一种基于图文交互的多模态数据融合方法,包括如下步骤:S1、获取多模态数据,所述多模态数据包括巡检图像数据和设备状态数据;S2、通过卷积神经网络获取巡检图像的图像特征图;S3、通过文本抽取器对设备状态数据进行预处理得到文本特征图;S4、构建多头注意力模块获取文本注意力权重和图像注意力权重;S5、基于文本注意力权重和图像注意力权重获取图像文本混合特征;S6、通过多头交叉注意力模块获取训练数据和目标的双向交互式信息;S7、通过特征图混合模块得到混合特征图信息并输出预测结果。方案通过对多模态特征进行融
一种基于图像融合的多模态图像目标检测方法.pdf
本发明涉及一种基于图像融合的多模态图像目标检测方法,包括:1)将预先采集好的红外图像及其可见光图像,制作多模态图像数据集;2)将预处理好的成对图像作为融合模型中生成模型G的输入;生成模型G基于U‑Net等全卷积网络,以残差网络为基础的卷积神经网络作为生成网络模型结构,包括收缩过程和扩张过程,收缩路径包括多个卷积加ReLU激活层再加最大池化(MaxPooling)结构,下采样的每一步特征通道数都增加一倍,输出生成的融合图像;融合图像输入融合模型中的判别网络模型;根据训练过程中损失函数的变化,按迭代次数调节
基于多模态数据融合的商品推荐方法.pdf
本发明提供了一种基于多模态数据融合的商品推荐方法,属于深度学习技术领域。通过ALBERT‑TextCNN提升从客户基本属性数据集中提取出的词向量的表征能力和最大程度保留客户不同层次的语义信息,提升不同客户群体的分类效果;通过AlBert‑BiLSTM‑CRF有效解决对于文本中一词多义解析效果差、多义词的不同语境无法处理等传统语言处理模型无法解决的问题,将客户线上和线下交易数据集进行更加符合文本集上下文语义的关键词,更有针对性地构建客户标签;使用k维树方法获取两种标签类别的相似客户,再通过相似客户购买历史进