预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

本发明公开了一种基于图文交互的多模态数据融合方法,包括如下步骤:S1、获取多模态数据,所述多模态数据包括巡检图像数据和设备状态数据;S2、通过卷积神经网络获取巡检图像的图像特征图;S3、通过文本抽取器对设备状态数据进行预处理得到文本特征图;S4、构建多头注意力模块获取文本注意力权重和图像注意力权重;S5、基于文本注意力权重和图像注意力权重获取图像文本混合特征;S6、通过多头交叉注意力模块获取训练数据和目标的双向交互式信息;S7、通过特征图混合模块得到混合特征图信息并输出预测结果。方案通过对多模态特征进行融合学习和分析,提高了识别精度。