一种时序-视觉提案图网络的时序动作检测方法.pdf
mm****酱吖
亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种时序-视觉提案图网络的时序动作检测方法.pdf
本发明涉及一种时序‑视觉提案图网络的时序动作检测方法,属于时序动作检测技术。该方法在提案图上并行使用时序图卷积网络和视觉图卷积网络:首先,为每个提案选择有价值的邻居提案,并将其构建为动作提案图,再采用图卷积网络根据邻居提案对分类的不同贡献从邻居提案中获取动作信息来构造一个视觉图卷积网络,采用提案特征的余弦相似度作为权重;在动作提案图上再构造一个与视觉图卷积网络并行的时序图卷积网络,通过提案之间的时序和视觉相关性聚合信息。在使用图卷积网络时,提出一种新的时序图卷积操作,该操作将邻居提案按照时序位置关系划分为
一种用于时序动作检测的图网络模型.pdf
本发明涉及一种用于时序动作检测的图网络模型,属于时序动作检测任务技术领域。在提议生成阶段,通过基本特征网络和提议生成网络获得动作提议;在获得动作提议后,在提议分类阶段预测其具体动作标签,在此阶段,提议分类网络具有跨尺度提议图模块和语义提议图模块,以获得高质量的提议特征,在跨尺度提议图模块中,设计了一个跨时间特征金字塔的图注意力卷积网络A来生成具有不同粒度时间上下文信息的提议特征M,在语义提议图模块中,将具有不同粒度时间上下文信息的提议特征M构建到提议图中,并利用图注意力卷积网络B在提议之间传递语义信息,得
基于时序-空间图的跨模态视频时序动作定位方法及系统.pdf
本发明属于数据表示技术领域,提供了基于时序‑空间图的跨模态视频时序动作定位方法及系统,包括:接收视频数据和自然语言查询信息;基于自然语言查询信息确定自然语言查询特征表示;基于视频数据确定候选视频时序动作片段特征表示;基于所述候选视频时序动作片段特征表示和所述自然语言查询特征表示,预测所述候选视频时序动作片段的时序偏移量以及所述候选视频时序动作片段与自然语言查询信息的相关性;通过对相关性得分最高的候选视频时序动作片段进行偏移量矫正,得到最终目标视频时序动作片段定位结果。本发明上述两种特征表示预测对应候选视频
时序动作提名方法及装置.pdf
本申请公开了一种时序动作提名方法及装置。其中,该方法包括:获取待处理视频,将待处理视频划分为多个第一视频片段;基于预训练的原子动作评估模型确定每个第一视频片段对应的原子动作概率,得到原子动作概率集;基于原子动作概率集合从多个第一视频片段对应的标记时间点中确定动作边界集合,并基于动作边界集合确定多个候选动作提名;提取每个候选动作提名对应的候选提名特征,并基于候选提名特征确定每个候选动作提名的置信度;基于多个候选动作提名的置信度对多个候选动作提名进行非极大值抑制处理,得到目标动作提名。本申请解决了相关技术中对
一种时序动作检测方法、装置、存储介质及终端.pdf
本发明公开了一种时序动作检测方法、装置、存储介质及终端,方法包括:获取动作视频;将动作视频输入到预先训练的动作检测网络中;其中,预先训练的动作检测网络是基于多个局部‑全局融合特征训练生成的,多个局部‑全局融合特征是根据局部自注意力模块和全局自注意力模块构建的;输出动作视频中的时序动作信息。本申请采用了自注意力模块,不仅能保留卷积层在视频中提取的长时序特征的信息,也能在长时序特征上捕获全局特征,从而减少了信息缺失,同时通过局部自注意力模块和全局自注意力模块构建多个局部‑全局融合特征,能对时序视频的上下文信息