基于多语义多模态信息的行为识别方法及装置-豆柴文库

基于多语义多模态信息的行为识别方法及装置.pdf

2023-04-24

10金币

821KB

25页

静芙****可爱

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共25页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

相关资料

基于多语义多模态信息的行为识别方法及装置.pdf

本发明公开了一种基于多语义多模态信息的行为识别方法及装置,该方法包括:通过摄像设备获取视频数据集合,并根据光流算法对视频数据集合中的每一个视频数据的帧数据集合进行计算,得到帧数据集合中每一个行为动作的关键帧数据以及关键帧数据的光流信息,将视频数据集合中的所有视频数据的关键帧数据以及关键帧数据的光流信息输入至深度学习网络,并通过深度学习网络提取出所有视频数据的初始特征值集合,将初始特征值集合输入至对应的语义识别网络,通过语义识别网络提取出对应的语义特征信息,并将语义特征信息输入至行为识别网络,通过行为识别网

2023-04-24

821KB

基于多模态语义嵌入的人体动作识别方法及系统.pdf

本发明涉及一种基于多模态语义嵌入的人体动作识别方法及系统，该方法包括：构建网络模型，其中包括一个用于提取视频时空特征的视频编码器和一个用于提取视频标签文本特征的文本编码器；提取视频中的时空特征以及视频标签中的文本特征，分别将时空特征和文本特征映射到一个公共空间；通过相似度计算模块，计算出两种模态之间的对称相似性得分；之后利用Kullback‑Leibler(KL)散度计算对比损失，对网络模型进行优化，使成对视频和标签表示相互靠近；利用所述优化后的模型对人体动作视频进行预测。本发明通过引入文本模态的信息，将

2023-06-02

469KB

基于多模态信息融合处理的文本识别方法.pdf

本发明披露一种基于多模态信息融合处理的文本识别方法。本发明中的多模态信息，包括图像信息和语意信息。在图像信息方面，选用胶囊网络提取像素特征；在语意信息方面，通过引入预处理语言模型构建语意胶囊模块，可以根据文本中前一时刻的字符，预测出下一个字符，为模型提供语意特征；在融合阶段中本发明对胶囊神经网络进行轻量化并对其内部的动态路由算法进行优化，使得在保留网络模型的识别精度的同时有效降低网络中神经元的数量，减少了网络的空间占用，提升运算速度。本发明提出的基于多模态信息融合处理的文本识别方法有效提高了字符文本的识别

2023-11-13

1.2MB

基于多模态的情绪识别方法.pdf

本发明的基于多模态的情绪识别方法，包括数据采集设备、输出设备、情绪分析软件系统，情绪分析软件系统通过对数据采集设备得到的数据进行综合分析推理，最终把结果输出至输出设备上；具体步骤为：基于面部图像表情情绪识别步骤、基于语音信号情绪识别步骤、基于文本语义情感分析步骤、基于人体姿态情绪识别步骤、基于生理信号情绪识别步骤，以及基于多轮对话语义理解步骤和基于时序多模态情绪语义融合关联判断步骤。本发明突破性的打通了五大单模态的情绪识别，创新性的利用深度神经网络将多个单模态的信息由神经网络编码、深度的关联和理解后进行综

2023-08-30

1.9MB

基于多模态语义匹配的图像风格迁移系统及方法.pdf

本发明揭示了一种基于多模态语义匹配的图像风格迁移系统及方法，包括内容图像输入模块、风格信息输入模块、风格图像向量库、文本图像检索模块、图像风格迁移模块和结果输出模块。本发明提供的多模态语义匹配的图像风格迁移系统及方法，实现了支持文本驱动和图像驱动两种模态数据提供风格信息的图像风格迁移，在图像风格迁移模块中利用注意力机制和插值操作逐渐调整风格图像特征分布与内容图像特征分布对齐，使得最终的风格化结果的内容语义区域和风格语义区域是相互匹配的，在保证风格化结果内容结构完整性的同时获得更好的风格化效果。

2023-06-07

700KB