一种基于时空卷积神经网络的视频目标分割方法-豆柴文库

一种基于时空卷积神经网络的视频目标分割方法.pdf

2023-11-15

10金币

417KB

6页

觅松****哥哥

实名认证

内容提供者

1/6

2/6

3/6

4/6

5/6

6/6

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110222595A(43)申请公布日2019.09.10(21)申请号201910421126.9(22)申请日2019.05.20(71)申请人中国科学院大学地址100049北京市石景山区玉泉路（甲）19号(72)发明人李国荣徐凯黄庆明(51)Int.Cl.G06K9/00(2006.01)G06K9/62(2006.01)G06N3/04(2006.01)权利要求书1页说明书3页附图1页(54)发明名称一种基于时空卷积神经网络的视频目标分割方法(57)摘要本发明涉及计算机视觉的技术领域，特别是涉及一种基于时空卷积神经网络的视频目标分割方法，其不需要依赖光流标注信息来训练光流模型，节省人力资源，提高视频分割准确度；包括：使用ResNet-101网络，前部均为卷积层，并且最后三个为反卷积层；使用三个跳过连接来连接低位图层功能以保留每个决议中的时空信息；输入为N幅连续的帧(It-N，It-(N-1)，……，It-1)，输出为预测的当前帧的图像I；并将此步骤设置为时间一致性分支；使用ResNet-101网络，其中均为卷积层；并且使用步长为1的空洞卷积替换卷积最后两个残余块中的层；使用金字塔池化模型来利用全局不同区域上下文信息；并将此步骤设置为空间分割分支。CN110222595ACN110222595A权利要求书1/1页1.一种基于时空卷积神经网络的视频目标分割方法，其特征在于，包括：使用ResNet-101网络，前部均为卷积层，并且最后三个为反卷积层；使用三个跳过连接来连接低位图层功能以保留每个决议中的时空信息；输入为N幅连续的帧(It-N，It-(N-1)，……，It-1)，输出为预测的当前帧的图像I；并将此步骤设置为时间一致性分支；使用ResNet-101网络，其中均为卷积层；并且使用步长为1的空洞卷积替换卷积最后两个残余块中的层；使用金字塔池化模型来利用全局不同区域上下文信息；并将此步骤设置为空间分割分支；使用元素添加来利用高级上下文，并连接时间相干特征以集成时间约束；使用来自先前粗尺度特征图的预测掩模来指导网络的集中，即使用逐元素乘法来掩盖中的特征映射；增强对象区域周围的特征，使网络逐渐集中在对象区域以获得准确的结果；并将此步骤设置为特征融合。2.如权利要求1所述的一种基于时空卷积神经网络的视频目标分割方法，其特征在于，还包括：预训练时间一致性分支，使用对抗性方式通过预测未来帧来训练时间一致性分支，具体包括：将时间相干分支设置为生成器G，并构造鉴别器D以从G和真实视频帧中识别所生成的视频帧；并且使用预训练的Inception-v3网络，最后一个完全连接(FC)层被随机初始化的2级FC层替换为鉴别器D；并且利用对抗性损失函数及视频帧预测损失函数和已有视频数据集训练该网络。3.如权利要求2所述的一种基于时空卷积神经网络的视频目标分割方法，其特征在于，还包括：预训练空间分割分支，使用现有的图像分割数据集或显著性物体数据集来预训练空间分割分支。4.如权利要求3所述的一种基于时空卷积神经网络的视频目标分割方法，其特征在于，还包括：线下迭代训练整个时空卷积网络，并利用DAVIS2016训练数据集来微调整体的参数，并且迭代训练时间一致性分支和空间分割分支：保持空间分割分支的参数固定不变，优化时间一致性分支的参数；之后保持时间一致网络的参数不变，优化空间分割分支。2CN110222595A说明书1/3页一种基于时空卷积神经网络的视频目标分割方法技术领域[0001]本发明涉及计算机视觉的技术领域，特别是涉及一种基于时空卷积神经网络的视频目标分割方法。背景技术[0002]视频对象分割(VOS)是许多视频分析任务的关键步骤，如视频摘要，视频编辑和场景理解。VOS旨在从视频剪辑中提取前景对象。现有的VOS方法可以根据人类参与的程度分为两种设置，即无监督和半监督。无监督的VOS方法不需要任何手动注释，而半监督方法依赖于第一帧中对象的带注释的掩码以保持对象分割结果的时间关联。[0003]现有的方法通常使用光流来模拟整个时间内的像素一致性以获得平滑度。然而，光流标注是一项艰巨的任务，需要大量人力，此外光流估计非常难，因此光流估计的结果往往准确较差。发明内容[0004]为解决上述技术问题，本发明提供一种不需要依赖光流标注信息来训练光流模型，节省人力资源，提高视频分割准确度的基于时空卷积神经网络的视频目标分割方法。[0005]本发明的一种基于时空卷积神经网络的视频目标分割方法，包括：[0006]使用ResNet-101网络，前部均为卷积层，并且最后三个为反卷积层；使用三个跳过连接来连接低位图层功能以保留每个决议中的时空信息；输入为N幅连续的帧(It-N，It-(N-1)，……

相关资料

一种基于时空卷积神经网络的视频目标分割方法.pdf

本发明涉及计算机视觉的技术领域，特别是涉及一种基于时空卷积神经网络的视频目标分割方法，其不需要依赖光流标注信息来训练光流模型，节省人力资源，提高视频分割准确度；包括：使用ResNet‑101网络，前部均为卷积层，并且最后三个为反卷积层；使用三个跳过连接来连接低位图层功能以保留每个决议中的时空信息；输入为N幅连续的帧(I

2023-11-15

417KB

一种基于深度卷积神经网络的特定目标轮廓图像分割方法.pdf

本发明属于图像识别技术领域，尤其涉及一种基于深度卷积神经网络的特定目标轮廓图像分割方法，包括：将用于训练的图像归一化到相同像素大小，对应的特定目标轮廓标注图像也归一化，送入卷积神经网络，经过数层卷积层与全连接层，在全连接层的最后一层得到图像表达，并与对应的标注图像比较得到预测误差；采用反向传播算法和随机梯度下降法来减小预测误差以训练该神经网络，得到特定目标轮廓图像分割的训练模型；将测试特定目标图像归一化到与训练图像相同的像素大小后送入训练模型，在全连接层的最后一层得到预测的图像表达从而得到整张特定目标轮廓

2023-09-04

328KB

一种基于卷积神经网络的人形靶分割方法.pdf

本发明公开了一种基于卷积神经网络的人形靶分割方法，属于计算机视觉识别领域，用以解决目前人形靶分割精度不高，人形靶识别分割速度慢及对复杂场景的适应能力较低的问题。方法包括：确定人形靶目标图像数据集，通过深度卷积网络提取图像特征，并利用得到的特征图构建FPN网络；将FPN网络特征同时输入一个分类网络及一个分割网络，两个网络并行执行；将两个网络的输出结果融合之后得到分割后的人形靶特征图，最后通过确定人形靶的位置信息，将人形靶区域从图像中截取出来，剔除背景的干扰，提高后续的弹孔检测速度与精度。该方法实现了快速高效

2023-07-25

491KB

基于卷积神经网络的视频检索方法及系统.pdf

本发明公开了一种基于卷积神经网络的视频检索方法及系统，所述方法包括：首先构建基于卷积神经网络的计算模型；通过图像数据对计算模型进行训练，得到优化计算模型；去除模型中的分类器，得到提取计算模型；对已有视频资源进行转场帧的提取，并通过提取计算模型提取得到转场帧的转场特征，建立转场特征数据库；将待检索的视频进行转场帧的提取得到转场特征，将转场特征在转场特征数据库中进行检索，得到视频的检索结果。所述基于卷积神经网络的视频检索方法及系统通过将视频内的转场帧作为数据处理的对象，不仅提高了检索过程的鲁棒性，而且去除了冗

2023-12-06

607KB

基于脉冲卷积神经网络的战场目标图像阈值分割方法.pdf

本发明公开了一种基于脉冲卷积神经网络的战场目标图像阈值分割方法，包括：利用多重卷积模板提取战场目标图像基本特征；建立IF神经元模型；通过初始化神经元模型参数、采用首脉冲触发方法对战场目标图像基本特征进行编码，搭建“输入层—中间层—输出层”的脉冲神经网络拓扑结构；利用感受野整合输入层脉冲序列，计算得到中间层每一个神经元与输入层神经元之间的连接权值，同时基于IF神经元模型计算中间层神经元的瞬时膜电位；基于阈值分割原理完成战场目标图像分割；采用二维熵来评价分割结果。与传统方法相比，使用本发明提出的战场目标图像分

2023-06-07

678KB