一种基于时序卷积建模的视频动作检测方法-豆柴文库

一种基于时序卷积建模的视频动作检测方法.pdf

2023-11-14

10金币

616KB

9页

猫巷****觅蓉

实名认证

内容提供者

1/9

2/9

3/9

4/9

5/9

6/9

7/9

8/9

9/9

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110688927A(43)申请公布日2020.01.14(21)申请号201910890368.2(22)申请日2019.09.20(71)申请人湖南大学地址410082湖南省长沙市岳麓区麓山南路1号湖南大学(72)发明人张汗灵龙亚艺(51)Int.Cl.G06K9/00(2006.01)G06K9/62(2006.01)权利要求书2页说明书5页附图1页(54)发明名称一种基于时序卷积建模的视频动作检测方法(57)摘要本发明提出一种基于时序卷积建模的视频动作检测方法，首先采用动作提案生成技术产生尽可能包含完整动作的提案片段；其次使用非极大值抑制配合加权IoU筛选出完整且重叠度高的提案，随后对提案进行稀疏采样得到指定数量的视频帧；采用深度网络模型提取视频帧的时空特征；然后对得到的帧级时空特征按演化模式划分成三个阶段，随后使用时序卷积对每个阶段的特征分别进行时序建模。最后使用分类器和回归器来预测动作类别和检测动作发生的时间区间。应用本发明可以克服提案的不完整性，同时最大限度的保留视频流的时序信息，进而更为精确的检测视频中的动作。CN110688927ACN110688927A权利要求书1/2页1.一种基于时序卷积建模的视频动作检测方法，其特征在于，所述方法包括：采用动作提案生成技术产生尽可能包含完整动作的提案片段；使用非极大值抑制配合加权IoU筛选出完整且重叠度高的提案，对提案进行稀疏采样得到指定数量的视频帧；采用深度网络模型提取视频帧的时空特征；对得到的帧级时空特征按演化模式划分成三个阶段，随后使用时序卷积对每个阶段的特征分别进行时序建模。使用分类器和回归器来预测动作类别和检测动作发生的时间区间，进而更为精确的检测视频中的动作。2.如权利要求1所述的方法，其特征在于，使用非极大值抑制算法配合加权IoU筛选出完整且重叠度高的提案，对提案进行稀疏采样得到指定数量的视频帧，包括：计算提案片段的加权IoU并将其作为非极大值抑制算法的搜索元素，执行算法剔除冗余提案片段。可选的，在训练过程中，将加权IoU作为正负样本分配的评价准则，预先设置合适的加权IoU大小作为阈值。根据预设的阈值将提案片段分为正样本集和负样本集。网络输入时，对提案片段进行稀疏采样，同时保证各演化阶段的帧数为预设比例。3.如权利1-2任一项所述的方法，其特征在于，利用以下公式计算每个提案片段与真实动作片段之间的加权IoU值：假设一个未裁剪的视频表示为有Lv帧。每个视频中的真实动作实例表示为这里的Ig代表视频V中真实动作实例的数量，和分别代表真实动作实例的开始时间和结束时间。首先，采用提案生成技术，对视频V生成多尺度的提案集，表示为Ls表示该视频中片段提案的数量。视频中第m个提案片段中的动作实例表示为Ip代表提案中动作实例的个数。首先计算提案片段中的第j个动作实例与该视频所有真实动作实例的时序区间的交集和并集的比值，IoU可以反映二者之间的重叠度。再计算两者的时序区间的交集和真实实例区间的比值，本方法将其称之为IoT，可以表示为它能够反映出动作提案片段的完整性。从而得到加权IoU：IoUw＝IoT*IoU。4.如权利要求1所述的方法，其特征在于，通过深度网络模型提取视频帧的时空特征其中fn为第n帧的一维特征向量。对特征按三个演化阶段进行划分，对各阶2CN110688927A权利要求书2/2页段特征应用一个对应的时序卷积对特征帧之间的时序关系进行建模来构建完整的上下文表征F，具体地：按照各阶段的预设比例将所有特征划分为三个阶段，开始，演化和结束；各阶段特征被输入到时序卷积层从而计算得到各自建模后的特征；将建模后的各阶段特征进行拼接形成完整上下文建模特征F＝{Fp，p＝0,1,2}。5.如权利要求1和4所述的方法，其特征在于，时序卷积建模子模块可表示为：一个时序卷积层可以被简单表示为Conv(lin,cout,k,s)，这里的lin,cout,kands分别代表输入数据长度，输出通道数，卷积核大小以及卷积核步长(stride)。时序卷积后的阶段特征可表示为：W和b表示时序卷积层的权重和偏置(bias)。3CN110688927A说明书1/5页一种基于时序卷积建模的视频动作检测方法技术领域[0001]本发明涉及图像、视频处理技术领域，具体是涉及一种基于时序卷积建模的视频动作检测方法。背景技术[0002]动作检测是近几年视频分析领域中备受关注的研究方向之一，它既要求识别动作类别又要定位出动作在未裁剪、任意长视频中发生的时间区间。[0003]自THUMOS’14挑战赛将时空定位任务切换为时序定位任务以来，近几年动作检测领域取得了快速的进展，然而高精度、高效率的动作检测依旧是视频分析领域的一个大难点。任务的

相关资料

一种基于时序卷积建模的视频动作检测方法.pdf

本发明提出一种基于时序卷积建模的视频动作检测方法，首先采用动作提案生成技术产生尽可能包含完整动作的提案片段；其次使用非极大值抑制配合加权IoU筛选出完整且重叠度高的提案，随后对提案进行稀疏采样得到指定数量的视频帧；采用深度网络模型提取视频帧的时空特征；然后对得到的帧级时空特征按演化模式划分成三个阶段，随后使用时序卷积对每个阶段的特征分别进行时序建模。最后使用分类器和回归器来预测动作类别和检测动作发生的时间区间。应用本发明可以克服提案的不完整性，同时最大限度的保留视频流的时序信息，进而更为精确的检测视频中的

2023-11-14

616KB

基于时序-空间图的跨模态视频时序动作定位方法及系统.pdf

本发明属于数据表示技术领域，提供了基于时序‑空间图的跨模态视频时序动作定位方法及系统，包括：接收视频数据和自然语言查询信息；基于自然语言查询信息确定自然语言查询特征表示；基于视频数据确定候选视频时序动作片段特征表示；基于所述候选视频时序动作片段特征表示和所述自然语言查询特征表示，预测所述候选视频时序动作片段的时序偏移量以及所述候选视频时序动作片段与自然语言查询信息的相关性；通过对相关性得分最高的候选视频时序动作片段进行偏移量矫正，得到最终目标视频时序动作片段定位结果。本发明上述两种特征表示预测对应候选视频

2023-07-24

552KB

一种基于分段图卷积网络的视频动作识别方法.pdf

本发明公开了一种基于分段图卷积网络的视频动作识别方法,包括以下步骤:A:获取每个视频段中的帧样本图像并进行图像增强;B:提取图像增强后的每个帧样本图像的外观特征和运动特征;C:构建基于每个视频段的特征关联图与时序一致性图及对应的关系连接矩阵;D:通过图卷积神经网络对输出特征进行增强得到输出特征;E:将输出特征与池化后的原始特征进行融合得到最终的时空特征;F:利用中期融合模型和后期融合模型进行动作,对分段识别的结果取平均值,得到待识别视频的动作识别结果。本发明能够提高视频动作的识别准确性。

2023-05-24

677KB

基于时空分离卷积和非对称卷积的视频特征提取模型的建模方法.pdf

本发明公开了一种基于时空分离卷积和非对称卷积的视频特征提取模型的建模方法，属于模式识别、机器视觉技术领域和视频处理技术领域，该方法包括：搭建C3D网络模型；将C3D网络的前四层卷积层转化为时空可分离卷积，将3D卷积明确分解为一个2D空间卷积和一个1D时间卷积的连续操作；对C3D网络的后四个卷积层进行改进以减少模型参数，将3D卷积改进为非对称卷积；构建基于时空分离卷积和非对称卷积的视频特征提取模型。本发明经实验表明，其优点是改进的模型在视频的特征提取方面效果更好，且对于模型参数也可以进行有效的压缩，具有较高

2023-06-01

752KB

一种基于深度卷积网络的视频显著性检测方法.pdf

本发明公开了一种基于深度卷积网络的视频显著性检测方法。本发明步骤：1：以视频的当前帧及其对应的光流图像作为特征提取网络的输入；2：将当前帧和对应的光流图像串接后得到的张量作为深度卷积网络输入提取特征；3：设计特征集成网络用于融合特征图，并得到对视频显著性检测的粗略估计；同时为了获得蕴含在特征图中卷积信息的补充性信息，特征集成网络引入原始信息，包括当前帧和对应的光流图像；4：模型中引入轮廓提取网络进行空域细化，轮廓提取网络采用线下训练方式，并用于检测物体的边缘轮廓。本发明为特征集成提供了丰富的辅助信息。进一

2023-08-28

818KB