预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

本发明公开了一种基于深度感知与语义引导的关系注意力网络视觉问答方法,包括以下步骤:1)图像目标之间的三维空间关系构建;得到图像目标之间的三维空间关系;2)根据图像目标之间的三维空间关系,获取图像目标i和j之间在空间维度的相关性分数;3)结合隐式注意力和显式注意力,获取图像目标i和j之间的相关性;4)根据Transformer的框架,采用改进后的注意力机制替换传统的自注意力层,获得视觉问答模型。本发明将三维空间的相关性引入到传统的自注意力机制上,提高视觉问答的准确性。