一种3D人体姿态估计模型训练方法-豆柴文库

一种3D人体姿态估计模型训练方法.pdf

2023-08-26

10金币

483KB

9页

努力****骞北

实名认证

内容提供者

1/9

2/9

3/9

4/9

5/9

6/9

7/9

8/9

9/9

在线预览结束，喜欢就下载吧，查找使用更方便

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111523379A(43)申请公布日2020.08.11(21)申请号202010165761.8(22)申请日2020.03.11(71)申请人浙江工业大学地址310014浙江省杭州市下城区朝晖六区潮王路18号(72)发明人吴哲夫肖新宇章莹婷李玮毅吕晓哲(74)专利代理机构杭州斯可睿专利事务所有限公司33241代理人王利强(51)Int.Cl.G06K9/00(2006.01)G06K9/62(2006.01)G06N3/04(2006.01)权利要求书2页说明书4页附图2页(54)发明名称一种3D人体姿态估计模型训练方法(57)摘要一种3D人体姿态估计模型训练方法，属于数字图像处理和机器学习的交叉技术领域，其中训练方法包括：构建姿态估计网络模型，获取目标3D样本图像，在样本图像上以固定间距设置锚点后将图像矩阵输入至网络模型，经过多轮迭代训练后得到训练好的姿态估计模型。利用训练好的网络模型可以对包含人体姿态的图像进行姿态估计。本发明采用空间设置锚点的方法，对人体的关节点坐标进行预测，能够获得很高的准确率；同时，计算量比传统的3D姿态估计要低得多，具有一定的应用前景。CN111523379ACN111523379A权利要求书1/2页1.一种3D人体姿态估计模型训练方法，其特征在于，所述方法包括以下步骤：步骤1：获取目标人体的3D图像，将图像输入到空间变换网络，输出增强后的图像；步骤2：在增强后的图像空间中设置锚点后输入到3D姿态估计网络的特征提取层，得到样本特征；步骤3：利用预测器对样本特征图进行预测，得到样本空间特征图中每个锚点对其他所有人体关节点的体素坐标偏移量和置信度，利用置信度对体素坐标偏移量进行加权求和得到空间样本图像中人体关节点的信息；步骤4：以空间样本图像中人体关节点坐标偏移损失和锚点的环绕损失最小为目的来训练网络模型，得到训练好的姿态估计模型。2.如权利要求1所述的一种3D人体姿态估计模型训练方法，其特征在于，所述步骤1中，3D图像要经过体素化处理。3.如权利要求1或2所述的一种3D人体姿态估计模型训练方法，其特征在于，所述步骤1中，空间变换网络由以下三个部分构成：第一个是本地化网络，它由常规的卷积神经网络构成，可以对变换参数进行回归；第二个是网格生成器，它在输入图像中生成与来自输出图像的每个体素相对应的坐标网格；第三个是采样器，它将转换参数应用到输入图像当中。4.如权利要求1或2所述的一种3D人体姿态估计模型训练方法，其特征在于，所述步骤2中，在图像空间中设置锚点的处理过程为：在3D样本图像的X轴、Y轴和Z轴三个方向上以固定的间距K设置多个锚点，K的取值范围为1个体素～10个体素。5.如权利要求1或2所述的一种3D人体姿态估计模型训练方法，其特征在于，所述步骤3中，获取人体关节点信息的处理过程为：利用预测器对样本特征图进行预测，得到样本特征图中每个锚点相对于其他目标人体关节点的体素坐标偏移量Oj(a)和置信度Cj(a):对所有锚点a的置信度C进行归一化处理，归一化函数为：其中，为归一化后的锚点a对于关节点j的置信度，a是锚点体素，A是锚点取值集和，j代表关节点，e为常数；利用归一化后的置信度对体素坐标偏移量进行加权求和得到样本图像中的目标关节点信息：其中，就是加权求和得到的关节点j的坐标，S(a)是锚点的体素坐标，Oj(a)是预测器预测得到的锚点a对于关节点j的体素坐标偏移。2CN111523379A权利要求书2/2页6.如权利要求5所述的一种3D人体姿态估计模型训练方法，其特征在于，所述步骤4中，空间样本图像中人体关节点坐标偏移损失为：其中，表示样本图像中目标关节点在相机坐标系下的偏移量标注；α表示权衡相机坐标系下和世界坐标系下产生的损失的权重，其取值范围为0.1～10；J表示样本图像中所有目标关节点的集和，j表示某个特定关节点，L1为空间样本图像中人体关节点坐标偏移损失，Lτ1为相机坐标系下的平滑系数。7.如权利要求5所述的一种3D人体姿态估计模型训练方法，其特征在于，所述步骤4中，空间样本图像中锚点环绕损失为：其中，L2为锚点环绕损失。8.如权利要求7所述的一种3D人体姿态估计模型训练方法，其特征在于，所述步骤4中，姿态估计网络模型在训练时，总的损失函数为：L＝λL1+(1-λ)L2其中，λ的取值范围为0～1。3CN111523379A说明书1/4页一种3D人体姿态估计模型训练方法技术领域[0001]本发明属于数字图像处理和机器学习的交叉技术领域，更具体地，涉及一种3D人体姿态估计模型训练方法。背景技术[0002]随着计算机视觉技术的发展，针对深度图以及RGB图的姿态估计技术快速发展。姿态估计在人机交互、增强现实、人体行为分

相关资料

一种3D人体姿态估计模型训练方法.pdf

一种3D人体姿态估计模型训练方法，属于数字图像处理和机器学习的交叉技术领域，其中训练方法包括：构建姿态估计网络模型，获取目标3D样本图像，在样本图像上以固定间距设置锚点后将图像矩阵输入至网络模型，经过多轮迭代训练后得到训练好的姿态估计模型。利用训练好的网络模型可以对包含人体姿态的图像进行姿态估计。本发明采用空间设置锚点的方法，对人体的关节点坐标进行预测，能够获得很高的准确率；同时，计算量比传统的3D姿态估计要低得多，具有一定的应用前景。

2023-08-26

483KB

一种基于几何驱动的自监督人体3D姿态估计网络训练方法.pdf

本发明涉及一种基于几何驱动的自监督人体3D姿态估计网络训练方法，属于人工智能计算机视觉领域，能够有效解决当前基于深度学习的人体3D姿态网络训练需要大量的人体3D关节点标注数据的技术问题。本发明方法，不依赖人体3D关节点标注数据，完全依靠几何先验知识，可以避免繁琐的人体3D关节点的标注过程，所提出的变换重投影损失可以探索多视角一致性以训练人体3D姿态估计网络，可以在训练过程中获得更加准确的人体3D姿态预测结果，所提出的根节点位置估计网络在3D姿态估计网络训练过程中保留重投影的2D姿态的尺度信息，可以在训练过

2023-11-14

1MB

姿态估计模型训练方法、姿态估计方法、装置和电子设备.pdf

本申请实施例公开了姿态估计模型训练方法、姿态估计方法、装置和电子设备。该方法的实施例包括：获取样本图像和样本图像中的关节点的初始热力图；将样本图像输入至待训练的姿态估计模型，得到样本图像中的关节点的尺度特征图、预测热力图和嵌入标签；基于尺度特征图对初始热力图进行调整，得到目标热力图；基于目标热力图、预测热力图以及嵌入标签，更新待训练的姿态估计模型的参数。该实施方式在保证处理效率的同时，提高了姿态估计结果的精度。

2024-01-09

800KB

人体姿态预测模型训练方法、人体姿态预测方法及装置.pdf

本申请提供了一种人体姿态预测模型训练方法、人体姿态预测方法及装置。该方法，包括：获取标注训练集和未标注训练集，标注训练集包括多张包含标注数据的第一人体图像，标注数据用于表示第一人体图像中的真实姿态信息；将第一人体图像输入人体姿态预测模型中的生成器，得到对应的第一人体姿态预测结果，并根据标注数据以及第一人体姿态预测结果计算生成器的第一损失值；将第二人体图像输入生成器，得到对应的第二人体姿态预测结果；根据第一人体图像、标注数据、第二人体图像以及第二人体姿态预测结果计算人体姿态预测模型中的判别器对应的第二损失值

2024-01-09

572KB

一种变电站场景下的实时3D人体姿态估计的方法.pdf

本发明涉及一种变电站场景下的实时3D人体姿态估计的方法，基于自顶向下和自底向上方法融合以及多层Transformer网络架构的3D姿态估计网络，实现了变电站作业场景下的人体3D关节点提取，提出基于自顶向下和自底向上方法融合的策略，分别计算自顶向下和自底向上两种方法生成的2D关节点结果相似度，并与人工设定阈值比较，实现自顶向下和自底向上两种方法的融合并提升了3D人体姿态估计的鲁棒性。本发明使用Transformer代替卷积神经网络，利用其自监督能力获取输入图像的时序信息与空间信息，改善对于遮挡目标的估计能力

2023-07-23

608KB