一种基于多模态信息融合的视频镜头自动挑选组合方法.pdf
一条****88
亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种基于多模态信息融合的视频镜头自动挑选组合方法.pdf
本发明涉及一种基于多模态信息融合的视频镜头自动挑选组合方法,属于音视频处理技术领域,首先对多机位多视频流的多模态信息进行实时的识别标记,其次构建了一套基于不同意境的多模态信息融合策略模型来决策视频片段的挑选,最终通过对应策略模型的特技图文渲染来自动完成视频的生成。本发明,可以实现多机位多流的实时自动化视频生产,对比原来需要通过非线性编辑软件对录制的视频文件进行人工的挑选和片段组合,可以极大的提升视频内容生产效率以及减少人力资源的投入。
一种基于视频上下文信息融合的多模态密集视频描述方法.pdf
本发明公开了一种基于视频上下文信息融合的多模态密集视频描述方法,用于处理密集视频描述任务。本发明步骤如下:步骤(1)、数据预处理,提取视频多模态数据特征;步骤(2)、建立多模态密集视频描述网络,并引入时间?语义关系模块;步骤(3)、模型训练,优化描述生成器,得到模型在视频上的文本描述;模型通过采用稀疏采样和引入时间?语义关系模块,解决了视频描述任务中普遍存在的视频信息冗余以及视频事件与事件之间关系的引入问题,从而减少了模型的计算量,提高了生成句子的连贯性与一致性。在数据集上的实验表明,通过使用这两种方法,
一种基于全局信息融合的多模态医学图像融合方法.pdf
本发明公开了一种基于全局信息融合的多模态医学图像融合方法,其步骤包括:1、对原始多个模态的医学图像进行色彩空间转换和图像剪切的预处理;2、建立在多个尺度通过融合模块进行交互的模态分支网络,并建立由Transformer构成的融合模块来合并多模态特征信息;3、建立重构模块,从多尺度的多模态特征合成融合图像;4、在公开数据集上训练并评估上述模型;4、利用训练好的模型实现医学图像融合任务。本发明通过Transformer融合模块和交互式模态分支网络能充分地融合多模态的语义信息,实现细粒度的融合效果,不仅很好地保
基于多模态信息融合的图像情感标注方法.docx
基于多模态信息融合的图像情感标注方法基于多模态信息融合的图像情感标注方法摘要:随着图像和多媒体数据的兴起,图像情感分析的重要性逐渐凸显。然而,由于图像是一种非结构化的数据,图像情感分析存在一定的挑战。为了解决这个问题,本文提出了一种基于多模态信息融合的图像情感标注方法。首先,我们通过文本挖掘技术从社交媒体中提取情感词汇。接着,我们利用深度学习方法提取图像的视觉特征。最后,我们使用一种融合算法将文本和图像特征进行结合,得到最终的情感标注结果。实验结果表明,我们的方法在图像情感标注任务中具有良好的性能。关键词
一种基于多模态信息融合的异常行为检测系统及方法.pdf
本发明提供一种基于多模态信息融合的异常行为检测系统及方法,其中该方法包括如下步骤:S1采集目标海域上船舶的AIS报文信息和雷达系统的雷达监测信息;S2基于获取的AIS报文信息和雷达监测信息对船舶进行一次异常行为检测处理,得到船舶的一次行为检测结果;S3针对一次行为检测结果为异常的目标船舶,根据该目标船舶的定位信息,进一步采集该目标船舶的视频图像信息;S4根据获取的目标船舶的视频图像信息进行二次行为检测处理,得到该目标船舶的二次行为检测结果。本发明有助于提高船舶监管系统对目标海域船舶监管的可靠性。