一种基于生成对抗网络的数据增强方法-豆柴文库

一种基于生成对抗网络的数据增强方法.pdf

2024-01-06

10金币

478KB

9页

努力****承悦

实名认证

内容提供者

1/9

2/9

3/9

4/9

5/9

6/9

7/9

8/9

9/9

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113487715A(43)申请公布日2021.10.08(21)申请号202110703465.3G06N3/04(2006.01)(22)申请日2021.06.24G06N3/08(2006.01)(71)申请人之江实验室地址310023浙江省杭州市余杭区文一西路1818号人工智能小镇10号楼(72)发明人吴郑华蔡思佳杨彦韬顾建军李特余小康(74)专利代理机构杭州求是专利事务所有限公司33200代理人邱启旺(51)Int.Cl.G06T15/00(2011.01)G06T17/10(2006.01)G06T19/20(2011.01)G06T3/00(2006.01)权利要求书2页说明书4页附图2页(54)发明名称一种基于生成对抗网络的数据增强方法(57)摘要本发明公开了一种基于生成对抗网络的数据增强方法。通过生成对抗网络的特征提取，将车辆图像的深层特征渲染到一个既定的三维立体结构上，完成一幅二维图像到三维立体结构的重构，再进行三维单眼投影，获得其在所需视角的二维图像，完成车辆不同视角图像的生成。本发明在前沿作者的noise‑to‑image的基础上进行了修正尝试，使其完成了从noise‑to‑image到image‑to‑image的转换，在此之后，可以做到定向修改一种特定属性(车辆视角等)，生成新视角的图像。CN113487715ACN113487715A权利要求书1/2页1.一种基于生成对抗网络的数据增强方法，其特征在于，包括：首先提取图像特征，编码至特征空间。然后生成3D骨架，将提取的图像特征融合进3D骨架，渲染生成3D框架。接着进行3D框架的视角回归。再利用三维仿射变换，生成新视角的3D框架。进一步将3D框架降维投影成2D图像。最后通过图像修复模型微调得到最终生成的新视角图像。2.如权利要求1所述基于生成对抗网络的数据增强方法，其特征在于，具体包括以下步骤：(1)给定待处理的原始图像xori，经过一个卷积层构成的特征提取模块，获取其高阶特征attrori：attrori＝Encoder(xori)(2)建立3D骨架，其网络层由三维卷积构成，输入为一个可学习的3维张量input，旨在从input里重建出一个正向的3D骨架。把步骤(1)提取的高阶特征attrori融合渲染进3D骨架，形成一个输入图像的3D框架x3D‑ori：x3D‑ori＝3Dmodel(attrori)(3)把3D框架x3D‑ori输入视角回归模型，进行视角回归任务得到θ1：θ1＝viewregression(x3D‑ori)由于期望最初生成的视角为正向视角(0，90，90)，给出一个损失罚项lossoriview：(4)选定目标新视角θtarget，进行三维仿射变换，生成新视角3D框架x3D‑new：x3D‑new＝Affine(x3D‑ori；θtarget)同时输入x3D‑new到回归模型进行视角回归得到θ2：θ2＝viewregression(x3D‑new)给出新视角的损失罚项lossnewview：(5)进行新视角的3D转2D投影操作，生成图像xnew：xnew＝Projection(x3D‑new)再接入一个图像修复模型进行生成图像微调，最终生成新视角图像xnewview：xnewview＝Repairmode(xnew)(6)为了保证其他属性的不变性，把图像xnewview再次输入到步骤(1)的特征提取模块中提取高阶特征attrnewview：attrnewview＝Encoder(xnewview)给出特征重建损失lossattr：最终总损失为：loss＝lossoriview+lossnewview+lossattr+lossadversarial其中，lossadversarial指代生成对抗网络的对抗损失。3.如权利要求2所述基于生成对抗网络的数据增强方法，其特征在于，步骤(2)中，输入input作为可学习参数，不作为模型正式的输入。4.如权利要求1所述基于生成对抗网络的数据增强方法，其特征在于，所述3D骨架为一2CN113487715A权利要求书2/2页个大致骨架，与提取的图像特征融合后才能形成对应的3D框架，融合方式采用特征拼接或自适应正则化方法等。3CN113487715A说明书1/4页一种基于生成对抗网络的数据增强方法技术领域[0001]本发明属于计算机视觉和图像生成领域，尤其涉及一种基于生成对抗网络的数据增强方法。背景技术[0002]在进行计算机视觉的模型训练时，常常会因为训练数据集不充分导致模型性能不佳，究其原因，是因为手上的训练集在整个样本空间中分布不均匀，只处于整个样本空间的某一特殊流形上，训练样本不能“完美概括”整个样本空间，导致

相关资料

基于生成对抗网络的数据增强方法.docx

基于生成对抗网络的数据增强方法基于生成对抗网络的数据增强方法摘要：生成对抗网络（GAN）是一种用于生成合成数据的强大工具，它由一个生成器网络和一个判别器网络组成，通过博弈过程使生成器网络能够生成更逼真的合成数据。在本论文中，我们将探讨基于GAN的数据增强方法，并分析其在不同领域中的应用。我们将介绍基本的GAN模型架构以及常用的数据增强技术，之后详细讨论了基于GAN的数据增强方法在计算机视觉、自然语言处理和医学图像处理等领域的应用。通过实验证明，基于GAN的数据增强方法可以显著提高模型的性能，同时还能有效解

2024-11-02

11KB

一种基于生成对抗网络的数据增强方法.pdf

本发明公开了一种基于生成对抗网络的数据增强方法。通过生成对抗网络的特征提取，将车辆图像的深层特征渲染到一个既定的三维立体结构上，完成一幅二维图像到三维立体结构的重构，再进行三维单眼投影，获得其在所需视角的二维图像，完成车辆不同视角图像的生成。本发明在前沿作者的noise‑to‑image的基础上进行了修正尝试，使其完成了从noise‑to‑image到image‑to‑image的转换，在此之后，可以做到定向修改一种特定属性(车辆视角等)，生成新视角的图像。

2024-01-06

478KB

基于生成对抗网络的图像数据增强方法研究.docx

基于生成对抗网络的图像数据增强方法研究基于生成对抗网络的图像数据增强方法研究摘要：随着深度学习的广泛应用，图像数据增强在许多计算机视觉任务中变得越来越重要。传统的数据增强方法通常包括裁剪、翻转、旋转和调整亮度等简单的操作。然而，这些方法往往无法充分利用原始图像中的信息，且无法生成更多的图像样本。生成对抗网络（GANs）作为一种强大的生成模型，已经引起了广泛的关注。本文旨在研究基于GANs的图像数据增强方法，并探讨其在计算机视觉任务中的应用。关键词：图像数据增强、生成对抗网络、深度学习、计算机视觉引言在计算

2024-10-18

10KB

一种基于生成对抗网络的矿物图像数据增强方法.pdf

本发明公开了一种基于生成对抗网络的矿物图像数据增强方法，通过矿物单粒图像的特征信息提取与表示实现无重复新图像数据。利用SRGAN矿物图像数据增强模型，可快速、高效地批量生成无重复矿物单粒图像新数据；相较于传统单样本图像数据增强方法，本发明能够有效扩充现有矿物图像数据中的图像特征丰富度。相较于传统多样本图像数据增强方法，本方明无需额外的复杂前处理流程，简化了矿物图像数据增强的步骤。通过拓展传统GAN模型的损失函数，提高了生成模型在矿物图像特征中的提取能力，能够充分提取矿物图像中的纹理、颜色、轮廓、反光、边缘

2023-08-19

1.5MB

基于生成对抗网络的人脸表情数据增强方法.pptx

基于生成对抗网络的人脸表情数据增强方法目录添加章节标题生成对抗网络（GAN）基础GAN的基本结构GAN的训练过程GAN的应用领域GAN的优缺点人脸表情数据增强的必要性人脸表情数据集的稀缺性数据增强对深度学习模型的重要性人脸表情数据增强的方法数据增强在人脸表情识别中的影响基于GAN的人脸表情数据增强方法基于GAN的数据增强方法介绍生成器与判别器的设计训练过程与优化策略实验结果与分析实验结果对比与分析不同数据增强方法的比较基于GAN的数据增强方法在人脸表情识别中的表现与其他先进模型的比较实验结果总结与讨论未来

2024-10-05

2.3MB