一种视频语义分割装置、训练方法以及视频语义分割方法-豆柴文库

一种视频语义分割装置、训练方法以及视频语义分割方法.pdf

2024-01-09

10金币

879KB

26页

一条****涛k

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共26页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114283352A(43)申请公布日2022.04.05(21)申请号202111342624.8(22)申请日2021.11.12(71)申请人北京旷视科技有限公司地址100096北京市海淀区西三旗建材城内建中路12幢一层1268号申请人北京迈格威科技有限公司(72)发明人马志明(74)专利代理机构北京超凡宏宇专利代理事务所(特殊普通合伙)11463代理人唐正瑜(51)Int.Cl.G06V20/40(2022.01)G06V10/26(2022.01)G06V10/74(2022.01)G06K9/62(2022.01)权利要求书2页说明书16页附图7页(54)发明名称一种视频语义分割装置、训练方法以及视频语义分割方法(57)摘要本申请实施例提供一种视频语义分割装置、训练方法以及视频语义分割方法，其中，所述视频语义分割方法包括：从待分割视频中获取与当前帧图像相邻的图像作为所述当前帧图像的参考图像；获取至少一帧参考图像中各参考图像的图像特征以及语义识别结果，其中，所述至少一帧参考图像是在视频序列中与当前帧图像相邻的前一帧或多帧图像；将所述各参考图像的图像特征、所述各参考图像的语义识别结果和所述当前帧图像输入视频语义分割模型，得到所述当前帧图像的语义分割结果。与相关技术既提升了语义分割的准确度又提升了语义分割的速度，并最终实现了实时的视频语义分割。CN114283352ACN114283352A权利要求书1/2页1.一种视频语义分割方法，其特征在于，所述视频语义分割方法包括：从待分割视频中获取与当前帧图像相邻的图像作为所述当前帧图像的参考图像；获取所述参考图像的图像特征和语义识别结果；将所述参考图像的图像特征、所述参考图像的语义识别结果和所述当前帧图像输入视频语义分割模型，并通过所述视频语义分割模型得到所述当前帧图像的语义分割结果。2.如权利要求1所述的视频语义分割方法，其特征在于，所述通过所述视频语义分割模型得到所述当前帧图像的语义分割结果，包括：获得所述当前帧图像与所述参考图像之间的特征相似度；根据所述特征相似度确定所述参考图像的语义识别结果对所述语义分割结果的影响程度；至少根据所述影响程度得到所述当前帧图像的语义分割结果。3.如权利要求2所述的视频语义分割方法，其特征在于，所述获得所述当前帧图像与所述参考图像之间的特征相似度，包括：获取所述当前帧图像的图像特征；根据所述当前帧图像的图像特征和所述参考图像的图像特征确定所述特征相似度。4.如权利要求2‑3任一项所述的视频语义分割方法，其特征在于，所述根据所述特征相似度确定所述参考图像的语义识别结果对所述语义分割结果的的影响程度，包括：根据所述参考图像与所述当前帧图像之间的特征相似度调整所述参考图像的语义分割结果，得到所述参考图像的参考语义分割结果，其中，所述参考语义分割结果用于表征所述影响程度；所述至少根据所述影响程度得到所述当前帧图像的语义分割结果，包括：获取所述当前帧图像的预分割特征；根据所述参考语义分割结果和所述预分割特征得到所述当前帧图像的语义分割结果。5.如权利要求1‑4任一项所述的视频语义分割方法，其特征在于，所述视频语义分割模型包括：编码器、解码器、乘法模块和相似度计算模块，且所述解码器包括多级上采样层和微调模块；所述通过所述视频语义分割模型得到所述当前帧图像的语义分割结果，包括：通过所述编码器和多级上采样层得到所述当前帧图像的预分割特征；通过所述编码器获取所述当前帧图像的图像特征；将所述当前帧图像的图像特征和所述参考图像的图像特征输入所述相似度计算模块，得到所述参考图像与所述当前帧图像之间的特征相似度；通过所述乘法模块将所述参考图像与所述当前帧图像之间的特征相似度与所述参考图像的分割掩码相乘，得到所述参考图像的参考语义分割结果；通过所述微调模块根据所述参考图像的参考语义分割结果以及所述预分割特征，得到所述当前帧图像的语义分割结果。6.如权利要求5所述的视频语义分割方法，其特征在于，所述参考语义分割结果对应参考分割掩码，且所述微调模块包括所述多级上采样层中的最后一级上采样层，其中，所述通过所述微调模块根据所述参考图像的参考语义分割结果以及所述预分割特征，得到所述当前帧图像的语义分割结果，包括：2CN114283352A权利要求书2/2页将所述参考图像的参考分割掩码与所述预分割特征在通道上进行拼接并输入到所述微调模块；通过所述微调模块执行的卷积操作获取所述当前帧图像的分割掩码。7.如权利要求1‑6任一项所述的视频语义分割方法，其特征在于，所述参考图像的图像特征是在获取所述参考图像的语义分割结果时由所述视频语义分割模型包括的编码器得到的。8.如权利要求1‑7任一项所述的方法，其特征在于

相关资料

一种视频语义分割装置、训练方法以及视频语义分割方法.pdf

本申请实施例提供一种视频语义分割装置、训练方法以及视频语义分割方法，其中，所述视频语义分割方法包括：从待分割视频中获取与当前帧图像相邻的图像作为所述当前帧图像的参考图像；获取至少一帧参考图像中各参考图像的图像特征以及语义识别结果，其中，所述至少一帧参考图像是在视频序列中与当前帧图像相邻的前一帧或多帧图像；将所述各参考图像的图像特征、所述各参考图像的语义识别结果和所述当前帧图像输入视频语义分割模型，得到所述当前帧图像的语义分割结果。与相关技术既提升了语义分割的准确度又提升了语义分割的速度，并最终实现了实时的

2024-01-09

879KB

语义分割模型训练方法及装置、图像语义分割方法及装置.pdf

本公开提供了一种语义分割模型训练方法、图像语义分割方法、语义分割模型训练装置、图像语义分割装置、电子设备和计算机可读存储介质，其中语义分割模型训练方法包括：获取训练集，训练集包括图像以及对应的标注信息；将图像进行特征提取，得到图像的特征数据；基于特征数据，得到第一分割框信息以及第一语义分割信息；基于特征数据、第一分割框信息以及第一语义分割信息，得到图像的第二分割框信息以及第二语义分割信息；基于第二分割框信息与标注信息、和/或基于第二语义分割信息与标注信息，确定损失值；基于损失值，调整语义分割模型的参数。语

2024-01-09

935KB

语义分割方法和语义分割装置.pdf

本申请提供了一种语义分割方法和语义分割装置，有利于提高语义分割结果准确率。该方法包括：获取目标图像，该目标图像包括航拍得到的RGB图像和深度图像，该深度图像是根据该RGB图像确定的；将该目标图像输入至语义分割网络，通过该语义分割网络对该目标图像进行特征提取，获取该目标图像的深度信息和语义信息，该特征提取包括细节特征提取、边缘特征提取、深度特征提取以及上下文特征提取；通过该语义分割网络对该深度信息和该语义信息进行特征融合，得到该目标图像的语义分割图像。

2023-07-25

905KB

一种视频语义场景分割及标注方法.pdf

本发明所述的视频语义场景分割及标注方法，包括以下步骤：基于有标注场景图像集离线训练深度卷积神经网络构建场景分类器；计算视频序列中相邻视频帧之间的相似度并对视频帧按照相似度分组；自适应调节相似度阈值获得视频帧帧数分布均匀的视频帧分组；合并包含帧数过少的帧分组，分裂包含帧数过多的帧分组以对视频帧分组结果重新调整；为每个视频帧分组选择代表性视频帧；利用场景分类器识别视频帧分组的场景类别；对视频序列进行语义场景分割及标注。本发明为解决视频的检索和管理问题提供了有效手段，并提高用户观看视频的体验和乐趣。

2023-12-05

530KB

视频目标分割方法及装置、视频目标分割模型的训练方法.pdf

本公开关于一种视频目标分割方法及装置、视频目标分割模型的训练方法。视频目标分割方法包括：获取待处理的视频；对于待处理视频中每个图像帧，将与图像帧相邻的至少一个相邻图像帧的目标掩膜和图像帧的像素矩阵输入到视频目标分割模型，得到图像帧的目标掩膜；基于待处理视频中每个图像帧的目标掩膜，对待处理视频进行目标分割；其中，视频目标分割模型通过下述方式被训练得到：基于针对训练视频样本中每个图像帧通过视频目标分割模型得到的预估掩膜和训练视频样本中每个图像帧的实际目标掩膜来调整视频目标分割贴模型的参数。

2023-07-24

738KB