一种基于视频时序信息的三维人体姿态迁移方法-豆柴文库

一种基于视频时序信息的三维人体姿态迁移方法.pdf

2023-11-05

10金币

669KB

11页

书生****22

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共11页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115761801A(43)申请公布日2023.03.07(21)申请号202211470729.6G06V10/80(2023.01)(22)申请日2022.11.23G06N3/0464(2022.01)G06N3/08(2022.01)(71)申请人同济人工智能研究院（苏州）有限公司地址215100江苏省苏州市相城区高铁新城青龙港路58号天成时代商务广场29、30层(72)发明人邓若愚胡尚薇(74)专利代理机构苏州创元专利商标事务所有限公司32103专利代理师王桦(51)Int.Cl.G06V40/10(2022.01)G06V10/40(2022.01)G06V10/82(2023.01)权利要求书1页说明书5页附图4页(54)发明名称一种基于视频时序信息的三维人体姿态迁移方法(57)摘要本发明涉及一种基于视频时序信息的三维人体姿态迁移方法，包括：通过源图像、参考姿态图像，提取空间、时间序列特征，经SMPL模型渲染输出SMPL参数，将SMPL参数投影至二维平面得到图像对应图；获取二维空间的顶点并计算重心坐标，通过匹配对应图得到转换矩阵并得到变换后的图像；对图像进行掩模，得到前景、背景图像；获取对应图的掩模，将背景图像、对应图的掩模在颜色通道进行连接，生成背景，获取注意力图和颜色图，重建图像及合成姿态迁移结果。本发明具有生成图像质量高，更好地保留人物身份特征等优点。CN115761801ACN115761801A权利要求书1/1页1.一种基于视频时序信息的三维人体姿态迁移方法，其特征在于：包括：S1：通过源人物图像、参考姿态图像，提取空间特征、时间序列特征，S2：提取图像特征，经SMPL模型渲染输出SMPL参数：人体姿态、形状参数以及三维人体网格，S3：将SMPL参数投影至二维平面，得到源人物图像、参考姿态图像的对应图；将三维人体网格投影到二维图像空间，得到二维空间的顶点，S4a：根据二维空间的顶点计算每个网格面的重心坐标，通过匹配对应图，得到转换矩阵，并用转换矩阵对图像进行变换，得到变换后的图像；S4b：基于图像的对应图对图像进行掩模，得到前景图像、背景图像；对图像的对应图进行二值化得到对应图的掩模，将背景图像、对应图的掩模在颜色通道进行连接，生成背景Obg，S5：提取源信息的特征，通过对提取的特征进行卷积操作得到注意力图A和颜色图P，利用注意力图A和颜色图P重建图像Os，合成姿态迁移结果Ot。2.根据权利要求1所述的基于视频时序信息的三维人体姿态迁移方法，其特征在于：在S1中：对参考姿态视频逐帧分割获得参考姿态图像，先用卷积神经网络CNN对视频中的帧提取空间特征，然后用门控循环神经网络GRU学习时间序列特征。3.根据权利要求2所述的基于视频时序信息的三维人体姿态迁移方法，其特征在于：在S2中：对于视频中的每一个关键帧，用ResNet50提取图像特征，并将特征编码为2048维的向量，再用SMPL模型渲染输出SMPL参数。4.根据权利要求1所述的基于视频时序信息的三维人体姿态迁移方法，其特征在于：在S2中：SMPL参数：{K，θ，β，M}，其中，K是根节点，M(θ，β)是一个可微分的函数，用于参数化顶点和三角面组成的网格。5.根据权利要求1所述的基于视频时序信息的三维人体姿态迁移方法，其特征在于：在S3中：通过弱透视投影将图像的三维人体网格投影到二维图像空间，得到二维空间的顶点：vs＝Proj(Vs,Ks)。6.根据权利要求1所述的基于视频时序信息的三维人体姿态迁移方法，其特征在于：在S4a中：转换矩阵T∈RH*W*2，其中，H*W是输入图像的分辨率。7.根据权利要求1所述的基于视频时序信息的三维人体姿态迁移方法，其特征在于：在S4b中：利用背景生成器生成背景，背景生成器包括编码器、解码器，在编码器阶段用多层卷积进行降采样，然后在解码器阶段用转置卷积进行上采样，使图像恢复到原来的大小。8.根据权利要求1所述的基于视频时序信息的三维人体姿态迁移方法，其特征在于：在S5中：注意力图为使用一通道的卷积核，关注位置信息；颜色图使用三通道的卷积核，关注颜色信息。9.根据权利要求1所述的基于视频时序信息的三维人体姿态迁移方法，其特征在于：在S5中：最终结果的生成过程可以概括为下面的公式：Os＝Ps⊙As+Obg⊙(1‑As)Ot＝Pt⊙At+Obg⊙(1‑At)。10.根据权利要求1所述的基于视频时序信息的三维人体姿态迁移方法，其特征在于：在S5中：合成过程中先学习多源特征之间的全局相似性，再将学到的相似性与多源特征在特征空间中进行线性组合，通过空间自适应归一化算法，将融合后的特征传送到全局特征中。2CN115761801A说明书1/5页一种基于视频时序信息的三维人体姿

相关资料

一种基于视频时序信息的三维人体姿态迁移方法.pdf

本发明涉及一种基于视频时序信息的三维人体姿态迁移方法，包括：通过源图像、参考姿态图像，提取空间、时间序列特征，经SMPL模型渲染输出SMPL参数，将SMPL参数投影至二维平面得到图像对应图；获取二维空间的顶点并计算重心坐标，通过匹配对应图得到转换矩阵并得到变换后的图像；对图像进行掩模，得到前景、背景图像；获取对应图的掩模，将背景图像、对应图的掩模在颜色通道进行连接，生成背景，获取注意力图和颜色图，重建图像及合成姿态迁移结果。本发明具有生成图像质量高，更好地保留人物身份特征等优点。

2023-11-05

669KB

一种基于三维人体参数化模型的姿态迁移方法.pdf

本发明公开了一种基于三维人体参数化模型的姿态迁移方法，包括：1)得到与源人物姿态和表情一致的目标人物三维人体参数化模型；2)将目标人物三维人体参数化模型不同的部位绑定不同的颜色进行渲染，得到姿态图像；3)对姿态图像进行图像操作后，得到头部以及身体姿态图；4)将头部以及身体姿态图像输入至人体部位生成模块，得到头部以及身体姿态迁移图像；5)对头部以及身体姿态迁移图像进行图像操作后，得到头部以及身体姿态迁移中间图像；6)将头部以及身体姿态迁移中间图像输入至融合模块，得到目标人物姿态迁移后的结果图像。本发明在保证

2024-01-06

608KB

一种基于多模态信息的三维人体姿态估计方法.pdf

本发明公开了一种基于多模态信息的三维人体姿态估计方法。该方法设计模拟了人体穿着衣物时的人体与衣物间的受力情况,并记录了这一数据。此外设计了一种适应压力传感器数据的人体姿态视觉真值获取方法,人在穿戴上压力数据获取设备的情况下在本发明设计的视频数据获取系统下做动作,通过视频获得人体三维姿态真值。最后将压力数据和人体三维姿态真值进行多模态对齐生成一个多模态数据集输入到本发明设计的三维人体姿态估计网络中训练模型。该方法有很长远的应用前景,使用人体与衣物间的压力数据进行人体姿态估计具有很好的发展潜力。

2023-05-01

695KB

基于深度可分离空洞时序卷积的三维人体姿态估计方法和装置.pdf

本发明一种基于深度可分离空洞时序卷积的三维人体姿态估计方法和装置，构建T层深度可分离空洞时序卷积模型，通过设置空洞率大小控制模型的感受野；在T层深度可分离空洞时序卷积块的两层卷积中，采用切片函数在两层卷积之间匹配特征维度信息进行残差连接，对矩阵内的数据进行提取特征，将数据原始特征累加到深度可分离空洞时序卷积块的输出当中，从而保留原始数据的特征；改进的改进的深度可分离空洞卷积层先执行点卷积，再执行逐通道卷积，并引进了Mish激活函数提高模型性能，增加了平滑和非单调的特点，本发明在实现降低模型计算复杂度和计算

2023-11-05

705KB

一种基于人体拓扑感知网络的三维人体姿态估计方法及系统.pdf

本发明涉及一种基于人体拓扑感知网络的三维人体姿态估计方法及系统。本方法利用人体拓扑的分层次结构和运动约束，充分捕捉信息密度稀疏的人体关节点数据中的先验信息，有效缓解了人体末端关节点估计精度不足的问题。本方法构建了一种多层次特征提取聚合框架，可以由细粒度到粗粒度依次提取关节点层次、肢体层次、全身层次的特征信息；构建了同一肢体内关节点间的运动约束关系，利用父节点辅助高误差的末端关节点的预测。本发明充分利用人体拓扑中高度结构化的先验信息，无需引入额外的数据，便可在控制模型参数量的情况下获得更丰富的人体姿态表征学

2023-06-04

1.4MB