用于生成行人图像的方法和装置及存储介质-豆柴文库

用于生成行人图像的方法和装置及存储介质.pdf

2023-11-01

10金币

362KB

8页

一条****然后

实名认证

内容提供者

1/8

2/8

3/8

4/8

5/8

6/8

7/8

8/8

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112257548A(43)申请公布日2021.01.22(21)申请号202011118547.3(22)申请日2020.10.19(71)申请人戴姆勒股份公司地址德国斯图加特(72)发明人张武强(74)专利代理机构北京永新同创知识产权代理有限公司11376代理人杨胜军(51)Int.Cl.G06K9/00(2006.01)G06K9/34(2006.01)G06K9/62(2006.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书1页说明书5页附图1页(54)发明名称用于生成行人图像的方法和装置及存储介质(57)摘要本发明涉及一种用于生成行人图像的方法，该方法包括：获取场景区域的图像数据集，并对图像数据的场景区域进行分类，其中，场景区域按照语义被分类为行人可行区域和其它区域；利用训练数据和场景区域分类信息训练图像区域分割模型；获取目标背景图像；利用经训练的图像区域分割模型对目标背景图像进行语义分割，从而得到目标背景图像的行人可行区域并将其输出；获取目标行人图像；在行人可行区域中确定目标行人图像的合成位置；将目标行人图像合成到目标背景图像中。本发明还涉及一种相应的装置和一种机器可读存储介质。CN112257548ACN112257548A权利要求书1/1页1.一种用于生成行人图像的方法，所述方法包括以下步骤：获取场景区域的图像数据集，并对图像数据的场景区域进行分类，其中，所述场景区域按照语义被分类为行人可行区域和其它区域；利用训练数据和场景区域分类信息训练图像区域分割模型；获取目标背景图像；利用经训练的图像区域分割模型对所述目标背景图像进行语义分割，从而得到所述目标背景图像的行人可行区域并将其输出；获取目标行人图像；在所述行人可行区域中确定所述目标行人图像的合成位置；以及将所述目标行人图像合成到所述目标背景图像中。2.根据权利要求1所述的方法，其中，所述在所述行人可行区域中确定所述目标行人图像的合成位置包括以下步骤：提取所述目标行人图像的合成位置的深度信息，根据所述深度信息确定所述目标行人图像的合理尺寸；以及根据所述目标行人图像的合成位置和尺寸将所述目标行人图像合成到所述目标背景图像中。3.根据权利要求1或2所述的方法，其中，所述方法还包括以下步骤：以朝自然逼真的方向对合成的图像进行优化，其中，对合成的图像的优化基于对抗生成式网络模型或者通过图像高斯滤波器实施。4.根据权利要求1-3中任一所述的方法，其中，所述图像区域分割模型是U-Net网络结构。5.根据权利要求2所述的方法，其中，所述深度信息借助深度传感器被提取。6.根据权利要求1-5中任一所述的方法，其中，所述方法用于自动驾驶场景下的行人图像合成。7.一种用于生成行人图像的装置，所述装置包括：可行区域获取单元，其用于对目标背景图像进行语义分割并得到行人可行区域；目标行人图像获取单元，其用于获取目标行人图像；以及合成单元，其用于将目标行人图像合成到所述目标背景图像中。8.根据权利要求7所述的装置，其中，所述装置还包括：深度获取单元，其用于获取所述目标背景图像的行人可行区域内的深度信息，以便输出到合成单元；和/或图像优化单元，其用于以朝自然逼真的方向对合成的图像进行优化。9.根据权利要求8所述的装置，其中，所述可行区域获取单元是基于U-Net网络结构的图像区域分割模型，和/或，所述图像优化单元是基于对抗生成式网络模型的图像生成模型或者是图像高斯滤波器。10.一种机器可读存储介质，在其上存储有程序指令，当所述程序指令由处理器执行时用于执行根据权利要求1至6之一所述的方法。2CN112257548A说明书1/5页用于生成行人图像的方法和装置及存储介质技术领域[0001]本发明涉及计算机技术领域及自动驾驶领域。具体地，本发明涉及一种用于尤其在自动驾驶场景下生成行人图像的方法和装置。背景技术[0002]人工神经网络(英文：ArtificialNeuralNetwork，缩写：ANN)是一种模仿动物神经网络行为特征的、通过对大量数据的分布式并行信息处理来学习数据特征的算法数学模型。人工神经网络依靠系统的复杂程度、通过调整内部多个节点之间的相互关系实现处理信息的目的，并且具有自学习和自适应的能力。[0003]在此，人工神经网络也可以用来学习生成目标图像。尽管现有生成式网络可以生成高质量的人物图像，但现有的生成式网络没有对背景进行语义识别分析，无法确保生成的图像的语义信息以及物理合理性，使得生成的图像不自然逼真。在自动驾驶场景下生成行人图像的情况下，现有的生成式模型无法确定在背景中合成的行人的合理位置和尺寸，因而合成的行人图像可能会出现在天空、树上等不合理的区域中，或者合成的

相关资料

用于生成行人图像的方法和装置及存储介质.pdf

本发明涉及一种用于生成行人图像的方法，该方法包括：获取场景区域的图像数据集，并对图像数据的场景区域进行分类，其中，场景区域按照语义被分类为行人可行区域和其它区域；利用训练数据和场景区域分类信息训练图像区域分割模型；获取目标背景图像；利用经训练的图像区域分割模型对目标背景图像进行语义分割，从而得到目标背景图像的行人可行区域并将其输出；获取目标行人图像；在行人可行区域中确定目标行人图像的合成位置；将目标行人图像合成到目标背景图像中。本发明还涉及一种相应的装置和一种机器可读存储介质。

2023-11-01

362KB

图像生成方法、装置、设备和存储介质.pdf

本发明实施例公开了一种图像生成方法、装置、设备和存储介质。该方法包括：依次获取一个目标字符作为当前处理目标字符；其中，所述目标字符用于生成目标图像；根据换行检测容器的换行检测结果，确定所述当前处理目标字符的位置，并渲染生成图像；返回执行所述依次获取一个目标字符作为当前处理目标字符的操作，直至处理完所有所述目标字符。上述技术方案，能够避免出现在字符应该换行时而不换行的问题以及在字符不应该换行而误换行的问题，实现了对图像生成过程中字符换行的精准控制。

2024-01-06

845KB

图像生成方法、装置、设备和存储介质.pdf

本发明实施例提供一种图像生成方法、装置、设备和存储介质，该方法包括：获取第一图像和第二图像，第一图像中包括第一目标对象对应的第一图像区域，第二图像中包括至少一个对象各自对应的图像区域。在第二图像中确定与第一图像区域尺寸匹配的第二图像区域，根据第二图像区域对应的视觉特征将第一图像区域变换至第二图像区域，以生成第三图像。在缺少第一目标对象对应的图像的情况下，可以借助已有的未包含第一目标对象的第二图像，自动生成包含第一目标对象的第三图像，且第三图像在外观视觉上与第二图像比较接近，生成的图像质量较高。

2023-07-22

1.6MB

图像生成方法、装置、设备和存储介质.pdf

根据本公开的实施例，提供了图像生成方法、装置、设备和存储介质。该方法包括获取与不同的参考光照条件下的天空相关联的一组参考图像；基于待渲染的目标光照条件，从一组参考图像中确定至少一个目标参考图像，至少一个目标参考图像的参考光照条件与目标光照条件的差异小于阈值；以及基于至少一个目标参考图像，生成与目标光照条件相关联的天空渲染图像。由此，可以提高电子设备生成的天空渲染图像的真实程度。

2024-01-04

1.2MB

用于生成证件图像的方法、系统、装置和介质.pdf

公开了一种用于生成证件图像的方法，包括：从证件特征因子库获取多个证件特征因子，所述证件特征因子是从多个真实证件图像提取的；将所述多个证件特征因子组合以便生成多个证件模板；用新证件特征因子替换所述多个证件模板中的对应证件特征因子以生成多个证件样本；以及采用机器学习算法来对每个证件样本执行质量风格迁移以生成一个或多个证件图像。本申请还涉及用于生成证件图像的系统、装置和介质。本申请的方案能够生成各种质量风格的大量逼真证件图像。

2023-05-25

1.4MB