一种基于几何驱动的自监督人体3D姿态估计网络训练方法-豆柴文库

一种基于几何驱动的自监督人体3D姿态估计网络训练方法.pdf

2023-11-14

10金币

1MB

12页

贤惠****66

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共12页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111062326A(43)申请公布日2020.04.24(21)申请号201911301729.1(22)申请日2019.12.17(66)本国优先权数据201911214042.42019.12.02CN(71)申请人北京理工大学地址100081北京市海淀区中关村南大街5号(72)发明人李侃李杨(74)专利代理机构北京理工正阳知识产权代理事务所(普通合伙)11639代理人张利萍(51)Int.Cl.G06K9/00(2006.01)G06K9/62(2006.01)权利要求书3页说明书6页附图2页(54)发明名称一种基于几何驱动的自监督人体3D姿态估计网络训练方法(57)摘要本发明涉及一种基于几何驱动的自监督人体3D姿态估计网络训练方法，属于人工智能计算机视觉领域，能够有效解决当前基于深度学习的人体3D姿态网络训练需要大量的人体3D关节点标注数据的技术问题。本发明方法，不依赖人体3D关节点标注数据，完全依靠几何先验知识，可以避免繁琐的人体3D关节点的标注过程，所提出的变换重投影损失可以探索多视角一致性以训练人体3D姿态估计网络，可以在训练过程中获得更加准确的人体3D姿态预测结果，所提出的根节点位置估计网络在3D姿态估计网络训练过程中保留重投影的2D姿态的尺度信息，可以在训练过程中获得更加准确的人体3D姿态预测结果，所提出的网络预训练方法可以帮助网络训练有效地收敛。CN111062326ACN111062326A权利要求书1/3页1.一种基于几何驱动的自监督人体3D姿态估计网络训练方法，其特征在于，包括以下步骤：步骤1：采集人体姿态训练数据，构造训练数据集；步骤2：对训练数据集中的人体2D关节点进行检测；步骤3：设计一个人体3D姿态估计网络，将人体2D关节点位置投射到3D空间中，估计人体的相对3D姿态；步骤4：设立一个根节点位置估计网络，估计出根关节点在对应相机坐标下的3D位置坐标，来还原人体关节点的3D绝对位置坐标；步骤5：根据透视投影，将步骤4得到的人体3D关节点的绝对位置重投影到2D空间；步骤6：进行相机坐标转换；步骤7：计算重投影损失函数、变换重投影损失函数和预训练损失；步骤8：进行网络训练；步骤9：使用训练好的3D姿态估计网络，对未知图片中的人体3D姿态进行估计。2.如权利要求1所述的一种基于几何驱动的自监督人体3D姿态估计网络训练方法，其特征在于，步骤1构造训练数据集时，利用多个相机进行标定，记录相机的内参和外参，其中，对于场景中的同一个人，收集多个视角下相机拍摄的照片，构造训练数据集。3.如权利要求1所述的一种基于几何驱动的自监督人体3D姿态估计网络训练方法，其特征在于，步骤2至步骤3的实现方法如下：在检测人体2D关节点时，在步骤1构造的训练数据集中，从同一时刻多个视角拍摄的图片中，任意选取两张，使用层级金字塔网络，对两张图片中的人体2D关节点位置进行检测，定义X1,分别步骤2得到的两张图片中人体的N个的关节点位置的2D坐标；步骤3.1：设计一个3D姿态估计网络该网络包含四个残差模块，每个模块均由2个全连接层及其对应的批归一化层、整流线性单位层和池化层组成；最后，3D姿态估计网络连接了一个N×3通道的全连接层输出N个关节点的3D位置坐标；步骤3.2：将步骤2中得到的人体2D关节点位置X1,X2输入到3D姿态估计网络中，得到网络输出为Y1,分别为Y1,Y2两张图片中人体N个关节点位置所对应的3D坐标；此处，网络输出的3D坐标，是以根关节点为坐标原点的相对位置坐标。4.如权利要求1所述的一种基于几何驱动的自监督人体3D姿态估计网络训练方法，其特征在于，步骤4的实现方法如下：步骤4.1：设计一个根节点位置估计网络该网络包含四个残差模块，每个模块均由2个全连接层及其对应的批归一化层、整流线性单位层和池化层组成；最后，网络连接了一个N通道的全连接层输根关节点在对应相机坐标下的3D位置坐标；步骤4.2：将步骤2中得到的人体2D关节点位置，输入到根位置估计网络中，得到网络输出为rv1,表示根关节点在两张图片对应视角v1,v2的相机坐标下的3D位置坐标；2CN111062326A权利要求书2/3页v1v2步骤4.3：将r和r分别加到Y1,Y2上，还原出对应的人体3D关节点的绝对位置坐标和5.如权利要求1所述的一种基于几何驱动的自监督人体3D姿态估计网络训练方法，其特征在于，步骤5的实现方法为：按照如下公式计算：其中，ρ表示透视投影，fx和fy为相机焦距，cx和cx定义了主要点，分别表示的第ith个关节点位置的x,y,z坐标值。6.如权利要求1所述的一种基于几何驱动的自监督人体3D姿态估计网络训练方法，其特征在于，步骤6的实现方法为：通过刚体变换公式τ

相关资料

一种基于几何驱动的自监督人体3D姿态估计网络训练方法.pdf

本发明涉及一种基于几何驱动的自监督人体3D姿态估计网络训练方法，属于人工智能计算机视觉领域，能够有效解决当前基于深度学习的人体3D姿态网络训练需要大量的人体3D关节点标注数据的技术问题。本发明方法，不依赖人体3D关节点标注数据，完全依靠几何先验知识，可以避免繁琐的人体3D关节点的标注过程，所提出的变换重投影损失可以探索多视角一致性以训练人体3D姿态估计网络，可以在训练过程中获得更加准确的人体3D姿态预测结果，所提出的根节点位置估计网络在3D姿态估计网络训练过程中保留重投影的2D姿态的尺度信息，可以在训练过

2023-11-14

1MB

一种3D人体姿态估计模型训练方法.pdf

一种3D人体姿态估计模型训练方法，属于数字图像处理和机器学习的交叉技术领域，其中训练方法包括：构建姿态估计网络模型，获取目标3D样本图像，在样本图像上以固定间距设置锚点后将图像矩阵输入至网络模型，经过多轮迭代训练后得到训练好的姿态估计模型。利用训练好的网络模型可以对包含人体姿态的图像进行姿态估计。本发明采用空间设置锚点的方法，对人体的关节点坐标进行预测，能够获得很高的准确率；同时，计算量比传统的3D姿态估计要低得多，具有一定的应用前景。

2023-08-26

483KB

一种基于人体拓扑感知网络的三维人体姿态估计方法及系统.pdf

本发明涉及一种基于人体拓扑感知网络的三维人体姿态估计方法及系统。本方法利用人体拓扑的分层次结构和运动约束，充分捕捉信息密度稀疏的人体关节点数据中的先验信息，有效缓解了人体末端关节点估计精度不足的问题。本方法构建了一种多层次特征提取聚合框架，可以由细粒度到粗粒度依次提取关节点层次、肢体层次、全身层次的特征信息；构建了同一肢体内关节点间的运动约束关系，利用父节点辅助高误差的末端关节点的预测。本发明充分利用人体拓扑中高度结构化的先验信息，无需引入额外的数据，便可在控制模型参数量的情况下获得更丰富的人体姿态表征学

2023-06-04

1.4MB

基于无监督域自适应的目标3D姿态估计方法.pdf

本发明公开了一种基于无监督域自适应的目标3D姿态估计方法，包括如下步骤：S1，获取航空器三维模型，将合成图像及合成图像对应的姿态标签作为训练数据输入到主干网络中进行模型预训练，得到初始模型；S2，获取真实图像；S3，将真实图像输入初始模型；S4，基于合成图像对应的姿态标签、真实图像对应的伪姿态标签及混合图像对应的姿态标签统计计算得到多尺度姿态原型；S5，利用输入图像及输入图像对应的标签训练初始模型；S6，循环步骤S3‑S5，循环预设次数后，得到优化模型；S7，将真实图像输入至优化模型，得到姿态估计结果。本

2023-07-21

561KB

一种基于二值化神经网络的人体姿态估计方法.pdf

本发明公开了一种基于二值化神经网络的人体姿态估计方法，属于计算机视觉和深度学习的模型压缩领域，首先，收集若干包括人姿态的图片，标记图片中每个人的关键点，逐张输入二维的高斯函数产生概率分布图，作为真实标签；然后，搭建二值化神经网络，逐张输入真实标签，使用改进的二值化的特征提取网络ReActNet进行特征提取；并利用二值化的上采样网络进行上采样，分别输出每个人体关键点的预测热力图；利用各预测热力图与真实标签进行拟合，训练二值化神经网络；最后，基于泰勒展开的坐标预测算法对热力图中每个关键点计算近似估计坐标，映射

2023-11-01

1.1MB