一种视频识别方法、装置、存储介质及设备.pdf
Jo****34
亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
一种视频识别方法、装置、存储介质及设备.pdf
本申请公开了一种视频识别方法、装置、存储介质及设备,该方法包括:首先获取待识别的目标视频,并从中提取多模态特征和通用特征;然后将目标视频的多模态特征和通用特征输入至预先构建的视频识别模型,识别得到目标视频的识别结果;其中,视频识别模型是根据预先获取的标签视频数据和通过近邻检索的方式查询到的置信度高于预设阈值的伪标签视频数据,以及根据置信度预先构建的目标损失函数训练得到的。可见,由于本申请是先通过近邻检索的方式更为简单、有效的查询到标签视频数据对应的伪标签视频数据,然后再利用根据置信度构建的目标损失函数来训
视频识别方法、装置、设备以及存储介质.pdf
本申请公开了一种视频识别方法、装置、设备以及存储介质,属于计算机技术领域。通过本申请实施例提供的技术方案,能够对多个视频帧特征进行编号,得到的多个特征编号就能够表示对应的视频帧特征。在编号过程中,结合了视频帧特征之间的相似度,也即是若两个视频帧特征的编号相同,也就能够表示两个视频帧特征之间的相似度较高,进一步就能够表示两个视频帧特征分别对应的两个视频帧之间的相似度较高。采用视频帧特征的编号来确定视频的第一重复度信息,就快速反映视频中视频片段的重复情况。当第一重复信息符合目标条件时,就能够将视频确定为目标类
视频语音识别方法、装置、设备和存储介质.pdf
本申请提出一种视频语音识别方法、装置、设备和存储介质,涉及语音识别技术领域其中,方法,包括:对视频进行处理,获取多个音频子片段,以及与每个音频子片段对应的图像帧序列;对图像帧序列进行文本识别,获取多个文本结果,并对多个文本结果进行处理,获取多个关键词;通过语音识别模型对每个音频子片段进行处理,获取多个候选语音识别结果;根据多个候选语音识别结果和多个关键词确定每个音频子片段的目标文本识别结果,根据每个音频子片段的目标文本识别结果,获取视频的语音识别结果。由此,通过视频的图像中的文本识别结果辅助视频语音识别,
一种视频片头片尾识别方法、装置、设备及可读存储介质.pdf
本发明提供一种视频片头片尾识别方法、装置、设备及可读存储介质,涉及视频识别技术领域。该方法包括:根据目标视频的识别信息,获取目标视频发生场景切换的第一时间范围;其中,识别信息包括声音、图像以及文字识别信息中的至少一项;对第一时间范围中第一时刻之前的第一时长内的多帧第一图像与第一时刻之后的第一时长内的多帧第二图像进行匹配,获取第一匹配结果;对第一时间范围中第一时刻之前的第一时长内的第一声音数据与第一时刻之后的第一时长内的第二声音数据进行匹配,获取第二匹配结果;根据第一匹配结果和第二匹配结果,获取目标视频的片
视频识别方法、装置、电子设备及存储介质.pdf
本申请公开了一种视频识别方法、装置、电子设备及存储介质。方法包括:确定第一视频的m个第一图像帧中的每个第一图像帧对应的n个第一特征向量;第一特征向量表征对应的第一图像帧的空间特征向量;从m个第一图像帧对应的第一特征向量中提取得到第二特征向量,并通过全连接层处理第二特征向量,得到第三特征向量;第二特征向量表征m个第一图像帧对应的时序特征向量;基于第三特征向量确定第一视频对应的第一对象和第二对象之间的第一行为类型;第三特征向量中的每个元素对应表征一种行为类型的概率;在第一行为类型是设定的行为类型的情况下,基于