一种基于有效特征表示的无偏场景图生成方法.pdf
Jo****31
亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种基于有效特征表示的无偏场景图生成方法.pdf
一种基于有效特征表示的无偏场景图生成方法,涉及计算机视觉技术。采用特征提取网络和分类网络解耦的训练策略,利用预训练好的骨干网络提取物体的视觉特征;进行目标检测,利用提取到的物体的视觉特征、物体的位置编码以及物体的类别编码两两配对再次组合编码,得到适用于谓词分类的编码特征;通过一个全连接层进行谓词分类;训练特征提取网络,在推理时不采用全连接层形式的分类网络,通过计算每一类谓词的用于谓词分类的编码特征的均值,根据待分类样本的编码特征与每一类谓词特征均值的余弦相似度进行谓词分类。摒弃全连接层分类器,直接基于谓词
一种基于层次结构的无偏置场景图生成方法.pdf
本发明公开了一种基于层次结构的无偏置场景图生成方法。本方法为:1)利用有偏模型对图像样本进行处理,得到有偏模型预测结果;根据各图像样本对应的所述有偏模型预测结果构建一层次化关系树;其中,所述有偏模型为场景图生成模型;2)根据所述层次化关系树和设定的层次化关系损失函数,计算损失值;然后基于所述损失值利用梯度反向传播方法优化所述有偏模型,使所述有偏模型输出结果迭代优化,最终输出无偏置场景图;3)对于一待处理的图像,将其输入步骤2)优化后的所述有偏模型,得到对应的无偏置场景图。本发明能够让模型由粗到细地学习不同
基于场景图更新与特征拼接的图像字幕生成方法.pdf
本发明公开了一种基于场景图更新与特征拼接的图像字幕生成方法,它解决了当前基于场景图的图像字幕模型中长短期记忆神经网络丢失先前输入的细节信息的问题,以及场景图更新机制中结点更新程度过大的问题。本发明首次提出了特征拼接网络,该网络对语言LSTM的输入变量做了改进,目的是尽可能多地保留原始输入信息,减少输入信息在计算过程中的损失。其次,本发明提出一种新的场景图更新机制来更新已访问过的结点权重,避免引起结点信息丢失的问题。同时,本发明设计了图更新系数来指导图更新,以确定更新程度的大小。本发明在官方数据集Micro
一种基于知识图谱的图像场景图生成方法.pdf
本发明公开了一种基于知识图谱的图像场景图生成方法,本发明首先使用OPENIE模型将图像描述转化成三元组,并转化成实体和实体对应关系,导入NEO4J中,构建COCO和VisualGenome数据集的知识图谱;其次模型结合知识图谱,对输入的图像进行目标检测,识别出对应的对象类别和对象属性,以及两两候选框之间有交集的关系。将得到的对象属性放入知识图谱中,作为检索关键点,并调用NEO4J数据库得到标记权重的关系节点以及对应的另一个实体节点;同理,将关系属性特征放入到知识图谱中,得到节点属性组;将通过知识图谱得到的
一种基于层级图卷积网络的群体场景图生成方法.pdf
本发明公开了一种基于层级图卷积网络的群体场景图生成方法,利用预训练卷积神经网络提取体育视频中所有个体的视觉特征和包围盒,聚类为两个队伍,根据视觉特征构造队伍关系图和群体关系图,将队伍关系图输入队伍图卷积网络提取队伍关系特征,将群体关系图输入群体图卷积网络提取群体关系特征,根据队伍关系特征和群体关系特征生成群体场景图,上述方法能有效捕捉体育视频中群体间关系,生成群体场景图进行体育视频理解。在团体对抗型体育项目中,运动员个体间关系被弱化,队伍间关系得到凸显,因此能简化场景图生成方法的应用场景,将场景图生成方法