一种基于深度神经网络的视频暴力检测方法及装置-豆柴文库

一种基于深度神经网络的视频暴力检测方法及装置.pdf

2023-07-25

10金币

678KB

12页

一条****丹淑

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共12页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113673364A(43)申请公布日2021.11.19(21)申请号202110859397.XG10L25/57(2013.01)(22)申请日2021.07.28(71)申请人上海影谱科技有限公司地址201718上海市青浦区金泽镇（西岑）水秀路318号108室(72)发明人宋波(74)专利代理机构北京万思博知识产权代理有限公司11694代理人孙黎生(51)Int.Cl.G06K9/00(2006.01)G06K9/62(2006.01)G06N3/04(2006.01)G06N3/08(2006.01)G10L25/30(2013.01)权利要求书2页说明书6页附图3页(54)发明名称一种基于深度神经网络的视频暴力检测方法及装置(57)摘要本申请公开了一种基于深度神经网络的视频暴力检测方法及装置，所述方法包括：检测目标视频中每个暴力子概念，所述暴力子概念为预先设置的传达暴力理念的K个客观的子概念；针对每个子概念，利用已训练的第一神经网络检测目标视频的视觉特征，利用已训练的第二神经网络检测目标视频的听觉特征；将所有子概念对应的所述视觉特征和所述听觉特征进行融合，根据融合得到的特征向量进行暴力行为检测。所述装置包括：暴力概念模块、混合特征模块和融合检测模块。本申请利用两个深度神经网络形成的暴力概念，最终形成一个暴力主题，从而达到了检测视频中普遍存在的暴力行为的目标。CN113673364ACN113673364A权利要求书1/2页1.一种基于深度神经网络的视频暴力检测方法，包括：检测目标视频中每个暴力子概念，所述暴力子概念为预先设置的传达暴力理念的K个客观的子概念；针对每个子概念，利用已训练的第一神经网络检测目标视频的视觉特征，利用已训练的第二神经网络检测目标视频的听觉特征；将所有子概念对应的所述视觉特征和所述听觉特征进行融合，根据融合得到的特征向量进行暴力行为检测。2.根据权利要求1所述的方法，其特征在于，利用已训练的第一神经网络检测目标视频的视觉特征包括：提取目标视频在预测间隔时间内的全部视频帧并计算所述全部视频帧之间的光通量以及光学加速度；利用所述已训练的第一深度神经网络模型进行视觉特征检测。3.根据权利要求1或2所述的方法，其特征在于，获得所述已训练的第一深度神经网络模型包括：采用C3D模型，遵循随机梯度下降算法对第一深度神经网络模型进行训练；对于训练集中的原始帧、光流和光加速度采用连续帧和相距P帧的连续光流和光加速进行模型训练；其中，P为正整数。4.根据权利要求1或2所述的方法，其特征在于，利用已训练的第二神经网络检测目标视频的听觉特征包括：对所述目标视频对应的音频信息进行特征提取，利用至少两种标准音频特征提取器生成特征向量；对生成的特征向量应用统计方法，对于不同提取器获得的特征向量进行串联，提取区别性的特征向量。5.根据权利要求4所述的方法，其特征在于，所述标准音频特征提取器包括：短时傅里叶变换特征提取器、离散余弦变换特征提取器、离散小波变换特征提取器、梅尔频谱和梅尔倒谱变换特征提取器。6.根据权利要求4所述的方法，其特征在于，将所有子概念对应的所述视觉特征和所述听觉特征进行融合，根据融合得到的特征向量进行暴力行为检测包括：将所述视觉特征和所述听觉特征进行视听融合网络的训练，视听融合网络将子概念训练形成的特征向量作为输入，输出目标视频中存在暴力的可能性结果。7.根据权利要求6所述的方法，其特征在于，将所述视觉特征和所述听觉特征进行视听融合网络的训练包括：利用视觉听觉特征融合网络管道中，并行处理每个子概念对应的所述视觉特征和所述听觉特征，生成视觉特征向量和听觉特征向量；利用浅层网络每个隐藏层分别针对神经元实现关于网络性能的最佳权衡；所述浅层网络根据视听特征权重，获得针对每个暴力概念训练的模型的最终特征；通过标准的Min‑Max归一化步骤传递特征向量。8.根据权利要求2所述的方法，其特征在于，提取目标视频在预测间隔时间内的全部视频帧之后还包括：2CN113673364A权利要求书2/2页对所述全部视频帧进行标准化处理，得到标准化视频帧数据集。9.一种基于深度神经网络的视频暴力检测装置，包括：暴力概念模块，设置为检测目标视频中每个暴力子概念，所述暴力子概念为预先设置的传达暴力理念的K个客观的子概念；混合特征模块，设置为针对每个子概念，利用已训练的第一神经网络检测目标视频的视觉特征，利用已训练的第二神经网络检测目标视频的听觉特征；融合检测模块，设置为将所有子概念对应的所述视觉特征和所述听觉特征进行融合，根据融合得到的特征向量进行暴力行为检测。10.一种计算设备，包括存储器、处理器和存储在所述存储器内并能由所述处理器运行的计算机程序，其中，所述

相关资料

一种基于深度神经网络的视频暴力检测方法及装置.pdf

本申请公开了一种基于深度神经网络的视频暴力检测方法及装置，所述方法包括：检测目标视频中每个暴力子概念，所述暴力子概念为预先设置的传达暴力理念的K个客观的子概念；针对每个子概念，利用已训练的第一神经网络检测目标视频的视觉特征，利用已训练的第二神经网络检测目标视频的听觉特征；将所有子概念对应的所述视觉特征和所述听觉特征进行融合，根据融合得到的特征向量进行暴力行为检测。所述装置包括：暴力概念模块、混合特征模块和融合检测模块。本申请利用两个深度神经网络形成的暴力概念，最终形成一个暴力主题，从而达到了检测视频中普遍

2023-07-25

678KB

一种基于深度神经网络的视频人脸检测方法及系统.pdf

本发明涉及一种基于深度神经网络的视频人脸检测方法及系统，所述一种基于深度神经网络的视频人脸检测方法包括：利用待测视频的截帧图像获取待测视频人脸特征向量；根据所述待测视频人脸特征向量与待识别人物特征向量得到待测视频检测结果，所述一种基于深度神经网络的视频人脸检测系统包括：采集模块，用于利用待测视频的截帧图像获取待测视频人脸特征向量；识别模块，用于根据所述待测视频人脸特征向量与待识别人物特征向量得到待测视频检测结果，在对每一帧图片进行人脸识别时，通过神经网络进行人脸特征检测并生成人脸特征向量，每个目标人物特征

2023-07-25

622KB

一种视频中暴力内容的检测方法及装置.pdf

本发明实施例提供一种视频中暴力内容的检测方法及装置，用以解决现有技术在对视频中暴力内容进行检测时误判率高的问题，提高对视频中暴力内容检测的准确率。所述视频中暴力内容的检测方法，包括：确定待检测视频中任一场景的镜头平均长度以及该场景中镜头的平均运动强度；当确定所述镜头平均长度小于第一预设阈值，和/或所述镜头的平均运动强度大于第二预设阈值时，提取该场景中多个元素的特征数据，当确定提取到的多个元素的特征数据中至少一个元素的特征数据，处于预先从特定场景中提取到的该元素的特征数据范围之内时，确定所述待检测的视频中包

2023-12-07

599KB

一种基于深度神经网络的视频自动着色方法.pdf

本发明公开了一种基于深度神经网络的视频自动着色方法,包括以下步骤:获取原始彩色视频数据集,将彩色视频转化为黑白视频,得到用于网络训练的黑白视频帧序列和彩色视频帧序列;分别计算彩色视频帧序列和黑白视频帧序列中相邻两帧间的正向和反向光流;从数据集中选择相邻的三帧输入至特征提取网络中提取出特征信息图;在目标图像中计算出每个像素点的相邻相似区域;将特征信息图输入初步着色网络得到每一帧图像的多张初步着色图;输入三帧的初步着色图输入光流对齐模块,利用时序损失函数来对初步着色网络进行约束;将初步着色网络的输出和光流对齐

2023-05-08

690KB

一种基于深度神经网络的夜间视频着色方法.pdf

本发明涉及一种基于深度神经网络的夜间视频着色方法，包括步骤：S1、建立目标检测神经网络模型，输入待处理的视频图像，利用目标检测算法，检测目标实例并生成裁剪的目标图像；S2、建立着色网络，通过构建两个端到端训练的骨干网络，包括实例着色网络和全图像着色网络，进行实例着色和全图像着色；再构建两个着色网络对应层级，进行端到端训练的全卷积神经网络；S3、建立融合模块，选择性地融合从实例着色网络和全图像着色网络中提取到的特征，最终获得着色后的夜间视频图像。本发明通过输入待处理的视频图像，将图像经过目标检测网络，实例图

2023-07-24

530KB