时序动作提名方法及装置.pdf
mm****酱吖
亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
时序动作提名方法及装置.pdf
本申请公开了一种时序动作提名方法及装置。其中,该方法包括:获取待处理视频,将待处理视频划分为多个第一视频片段;基于预训练的原子动作评估模型确定每个第一视频片段对应的原子动作概率,得到原子动作概率集;基于原子动作概率集合从多个第一视频片段对应的标记时间点中确定动作边界集合,并基于动作边界集合确定多个候选动作提名;提取每个候选动作提名对应的候选提名特征,并基于候选提名特征确定每个候选动作提名的置信度;基于多个候选动作提名的置信度对多个候选动作提名进行非极大值抑制处理,得到目标动作提名。本申请解决了相关技术中对
一种时序提名的生成方法、装置、设备及介质.pdf
本公开提供了一种时序提名的生成方法、装置、设备及介质,涉及人工智能技术领域,尤其涉及计算机视觉和深度学习技术领域,具体可用于视频分析场景下,包括:提取待处理视频对应的目标图像特征序列,并根据目标图像特征序列,获取多个候选时序提名;根据目标图像特征序列,获取包括动作特征和背景特征间差异信息的动作关联特征和背景关联特征;进而根据动作关联特征和背景关联特征,获取各候选时序提名的动作得分和背景得分;并最终根据各动作得分和背景得分,在各候选时序提名中确定与待处理视频对应的目标时序提名。本公开实施例的技术方案,通过在
模型构建及训练方法和装置、时序动作定位方法和装置.pdf
本公开涉及一种模型构建及训练方法和装置、视频时序动作定位方法和装置。该模型训练方法包括:采用第一视频数据和第二视频数据对动作预知网络模型进行训练,使得训练完成的动作预知网络模型用于实现待测视频数据的时序动作定位,其中,第一视频数据为包含时域标注的长视频数据,第二视频数据为动作短片段视频数据,待测视频数据为不包含时域标注的长视频数据,第一视频数据的数量小于第二视频数据的数量。本公开通过一种适用于大规模动作类别的时序动作定位模型,可以成功将时序动作定位模型扩展到更广泛的动作类别集。
一种时序动作检测方法、装置、存储介质及终端.pdf
本发明公开了一种时序动作检测方法、装置、存储介质及终端,方法包括:获取动作视频;将动作视频输入到预先训练的动作检测网络中;其中,预先训练的动作检测网络是基于多个局部‑全局融合特征训练生成的,多个局部‑全局融合特征是根据局部自注意力模块和全局自注意力模块构建的;输出动作视频中的时序动作信息。本申请采用了自注意力模块,不仅能保留卷积层在视频中提取的长时序特征的信息,也能在长时序特征上捕获全局特征,从而减少了信息缺失,同时通过局部自注意力模块和全局自注意力模块构建多个局部‑全局融合特征,能对时序视频的上下文信息
时序动作检测方法、装置、计算机设备及存储介质.pdf
本申请提供了一种时序动作检测方法、装置、计算机设备及存储介质,属于人工智能领域。方法包括:对连续的多个图像帧进行特征提取,得到不同长度的多个时序特征;基于多个时序特征中最长的时序特征,获取目标特征;对于多个时序特征中的任一时序特征,基于时序特征,获取第一时间定位信息,第一时间定位信息表征时序特征中各目标时刻对应的动作开始时刻和动作结束时刻;基于时序特征、第一时间定位信息以及目标特征,对第一时间定位信息进行修正,得到第二时间定位信息。上述技术方案,不需要对各目标时刻设置锚框值来预测对应的定位框,从而减少了处