基于多模态双流3D网络的视频人体行为识别方法及系统.pdf
一条****88
亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
基于多模态双流3D网络的视频人体行为识别方法及系统.pdf
本发明公开了一种基于多模态双流3D网络的视频人体行为识别方法及系统,包括:基于深度视频生成的深度动态图序列DDIS;基于RGB视频生成的姿势评估图序列PEMS;将深度动态图序列和姿势评估图序列分别输入到3D卷积神经网络中,构造DDIS流和PEMS流,得到各自的分类结果;将得到的分类结果进行融合,得到最终的行为识别结果。本发明有益效果:DDIS通过对视频的局部时空结构信息进行建模,能够很好地描述长时行为视频中的人体运动以及交互物体的轮廓。PEMS能够清晰地捕捉人体姿态的变化,消除背景杂乱的干扰。多模态双流3
基于双流卷积神经网络的人体行为识别方法.docx
基于双流卷积神经网络的人体行为识别方法基于双流卷积神经网络的人体行为识别方法摘要:人体行为识别在计算机视觉领域中具有重要应用价值,如智能监控、人机交互等。然而,传统的人体行为识别方法面临着识别准确性和实时性的挑战。本文提出了一种基于双流卷积神经网络的人体行为识别方法,该方法通过同时考虑时空和频域特征,利用双流卷积神经网络实现了高精度的人体行为识别。实验结果表明,该方法在多个数据集上取得了较好的识别效果,具有实时性和鲁棒性。关键词:人体行为识别;双流卷积神经网络;时空特征;频域特征1.引言人体行为识别是计算
基于多模态语义嵌入的人体动作识别方法及系统.pdf
本发明涉及一种基于多模态语义嵌入的人体动作识别方法及系统,该方法包括:构建网络模型,其中包括一个用于提取视频时空特征的视频编码器和一个用于提取视频标签文本特征的文本编码器;提取视频中的时空特征以及视频标签中的文本特征,分别将时空特征和文本特征映射到一个公共空间;通过相似度计算模块,计算出两种模态之间的对称相似性得分;之后利用Kullback‑Leibler(KL)散度计算对比损失,对网络模型进行优化,使成对视频和标签表示相互靠近;利用所述优化后的模型对人体动作视频进行预测。本发明通过引入文本模态的信息,将
基于3D卷积神经网络的人体行为识别方法.docx
基于3D卷积神经网络的人体行为识别方法基于3D卷积神经网络的人体行为识别方法摘要:人体行为识别是计算机视觉领域的重要研究方向之一,具有广泛的应用前景。本论文着重研究基于3D卷积神经网络的人体行为识别方法。首先介绍了人体行为识别的背景和意义,然后详细介绍了3D卷积神经网络的原理和基本结构。接着,讨论了数据集的选择和预处理方法。随后,详细描述了基于3D卷积神经网络的人体行为识别的实现过程,并进行了实验验证。最后总结了本论文的主要工作,并指出了未来的研究方向。关键词:人体行为识别、3D卷积神经网络、数据集、预处
基于多损失双流卷积神经网络的人体动作识别方法.pdf
本发明公开了基于多损失双流卷积神经网络的人体动作识别方法,它属于动作识别技术领域,解决了传统的双流网络动作细节信息丢失和无法提取时空特征的问题。本发明是对时序分割网络的改进,由多损失空间网络和时间网络构成,从体系结构角度来看,多损失双流卷积神经网络由三个分支构成:动作识别、动作复原和差异惩罚。动作复原加入了复原损失,保留动作细节信息和平衡提取的动作特征信息。差异惩罚利用外观特征计算动作特征进行分类,从而得到有效的时空特征。多损失双流卷积神经网络以端到端的方式训练学习,并利用动作识别损失、复原损失和差异损失