基于跨模态置信度感知的图像文本匹配方法.pdf
一条****ee
亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
基于跨模态置信度感知的图像文本匹配方法.pdf
本发明涉及跨模态检索领域,公开了一种基于跨模态置信度感知的图像文本匹配方法,以待匹配文本为桥梁,参考图像‑文本的全局语义,来衡量图像区域在待匹配文本中被描述的可信程度。并且,本发明在聚合区域‑单词匹配对的局部对齐信息以得到图文整体相关性时,根据匹配置信度来过滤掉与全局图像‑文本语义不一致的局部区域‑单词匹配对,更准确地度量的图文相关性,提升跨模态检索性能。
一种基于音乐-图像语义关系的跨模态匹配方法.pdf
本发明公开一种基于音乐‑图像语义关系的跨模态匹配方法,涉及音乐和图像匹配方法技术领域,包括以下步骤:采集图像和音乐成对数据,并对数据进行特征提取后得到训练集;利用训练集特征训练深度神经网络模型得到跨模关系模型;根据跨模关系模型对待预测图像进行音乐推荐。解决了现有图像音乐匹配关系建模效果不佳,推荐的音乐内涵与图像内涵匹配度低的问题。
模型训练方法、跨模态表征方法、无监督图像文本匹配方法及装置.pdf
本发明的目的是提供一种模型训练方法、跨模态表征方法、无监督图像文本匹配方法及装置,所述方法包括:计算训练文档中图片与句子的两两相似度值;基于所述相似度值,确定正样本对集和负样本对集;其中,所述正样本对集中有预设数量的正样本对;所述负样本对集中有预设数量的负样本对;所述正样本对集和所述负样本对集用于进一步训练所述模型,直至预设数量的所述正样本对的平均相似度值大于预设数量的所述负样本对的平均相似度值,且两者差值符合预设条件。上述实施方式可以减小采样的偏差,以更好的训练模型来对图片和句子进行匹配。
基于生成对抗网络的甲状腺超声图像文本跨模态检索方法.docx
基于生成对抗网络的甲状腺超声图像文本跨模态检索方法标题:基于生成对抗网络的甲状腺超声图像文本跨模态检索方法摘要:甲状腺疾病是常见的内科疾病之一,超声图像和相关的文本描述是诊断甲状腺疾病的重要依据。然而,超声图像和文本之间存在着跨模态的关联,利用这种关联可以提高甲状腺疾病的诊断准确性。本文基于生成对抗网络(GAN),提出了一种甲状腺超声图像文本跨模态检索方法,通过训练GAN模型实现超声图像和文本之间的映射关系,从而实现超声图像文本的跨模态检索。关键词:甲状腺超声图像,文本检索,生成对抗网络,跨模态一、引言甲
基于跨模态文本检索注意力机制的文本指导图像分割方法.pdf
一种基于跨模态文本检索注意力机制的文本指导图像分割方法,该方法将文本作为查询向量,多模态特征作为检索空间,自适应关注多模态特征空间中与文本相似区域,定位目标物体。该方法包括:特征提取、图文信息深度融合、深层次关系捕捉和多层级特征混合。采用卷积网络和长短时记忆网络提取视觉、语言特征;使用哈达玛积将视觉、语言特征信息深度融合;采用基于文本查询的注意力机制获取图片场景中与文本描述相似区域,最后将多个层级的特征混合分割目标物体。该方法能够在复杂场景下有效提高定位目标的准确度,实现区域的精确分割。