一种跨模态语义生成图像模型和方法.pdf
冬易****娘子
亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种跨模态语义生成图像模型和方法.pdf
本发明提供了一种跨模态语义生成图像模型和方法,采用了深度学习领域的生成对抗网络技术,结合自然语言处理领域的Bert模型提取文本描述的特征向量作为图像生成的条件,从而生成符合文本描述的图像,实现了由文本描述产生图像的功能。本发明提出了自适应语义特征融合模块,通过跨模态的方式调整生成图像,将语义特征更好地融合到图像生成的过程中,更加有效地构建文本与图像之间的映射关系,使得生成图像更加贴合语义描述。本发明将对比学习的方法应用到跨模态语义图像生成研究中,提出基于对比学习的损失函数,通过其约束文本特征与图像特征之间
一种基于音乐-图像语义关系的跨模态匹配方法.pdf
本发明公开一种基于音乐‑图像语义关系的跨模态匹配方法,涉及音乐和图像匹配方法技术领域,包括以下步骤:采集图像和音乐成对数据,并对数据进行特征提取后得到训练集;利用训练集特征训练深度神经网络模型得到跨模关系模型;根据跨模关系模型对待预测图像进行音乐推荐。解决了现有图像音乐匹配关系建模效果不佳,推荐的音乐内涵与图像内涵匹配度低的问题。
基于生成对抗网络的图像语义分割模型构建方法和装置.pdf
本申请公开了一种基于生成对抗网络的图像语义分割模型构建方法和装置,该方法使用分割模型训练源域数据集,再使用生成对抗网络将源域数据集转换为新的目标域数据集,该新的目标域数据集保留了源域数据集中图像的结构特征但同时具有目标域数据集的全局特征,因此使用新的目标域数据集微调源域分割模型将降低源域和目标域的域移位影响,并且不会对数据的其他图像特征产生负影响,提高了图像语义分割模型的泛化能力,提高了自适应图像语义分割模型的精度和效率。如此,通过使用生成对抗网络有效的减少了源域和目标域间域移位的影响,提高了自适应图像语
基于生成对抗网络的甲状腺超声图像文本跨模态检索方法.docx
基于生成对抗网络的甲状腺超声图像文本跨模态检索方法标题:基于生成对抗网络的甲状腺超声图像文本跨模态检索方法摘要:甲状腺疾病是常见的内科疾病之一,超声图像和相关的文本描述是诊断甲状腺疾病的重要依据。然而,超声图像和文本之间存在着跨模态的关联,利用这种关联可以提高甲状腺疾病的诊断准确性。本文基于生成对抗网络(GAN),提出了一种甲状腺超声图像文本跨模态检索方法,通过训练GAN模型实现超声图像和文本之间的映射关系,从而实现超声图像文本的跨模态检索。关键词:甲状腺超声图像,文本检索,生成对抗网络,跨模态一、引言甲
多模态分类模型生成方法和装置.pdf
本公开提供了一种多模态分类模型生成方法和装置,涉及人工智能技术领域。该方法的一具体实施方式包括:获取预置的样本集,样本包括至少两个不同模态的子样本;获取预先建立的多模态融合网络,多模态融合网络包括:门限模块、模态融合模块以及至少两个分别对不同模态数据进行分类的分类模型;从样本集中选取样本;将该样本的不同模态的子样本分别输入至与各模态对应的分类模型,得到各个分类模型输出的特征向量,通过门限模块提取所有的特征向量的门限向量,并将所有的特征向量和门限向量输入模态融合模块,若多模态融合网络满足训练完成条件,则将多