视频的识别方法、装置、可读介质和电子设备-豆柴文库

视频的识别方法、装置、可读介质和电子设备.pdf

2023-07-25

10金币

828KB

22页

一条****然后

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共22页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113723341A(43)申请公布日2021.11.30(21)申请号202111050220.1(22)申请日2021.09.08(71)申请人北京有竹居网络技术有限公司地址101299北京市平谷区林荫北街13号信息大厦802室(72)发明人佘琪张林王长虎(74)专利代理机构北京英创嘉友知识产权代理事务所(普通合伙)11447代理人魏云鹿(51)Int.Cl.G06K9/00(2006.01)G06K9/62(2006.01)G06N3/08(2006.01)权利要求书2页说明书13页附图6页(54)发明名称视频的识别方法、装置、可读介质和电子设备(57)摘要本公开涉及一种视频的识别方法、装置、可读介质和电子设备，涉及图像处理技术领域，该方法包括：对获取到的待处理视频进行预处理，以得到目标视频，将目标视频输入预先训练的识别模型，以得到识别模型输出的识别结果，识别结果用于表征待处理视频的类别；识别模型包括编码器和投射层，编码器为根据多个预投射层和第一数量个预训练视频，预训练得到的，每个预投射层用于提取预训练视频的一种视频特征，识别模型为根据经过预训练的编码器，和第二数量的训练视频训练得到的，第二数量小于第一数量，预训练视频不具有用于指示类别的类别标签。本公开中能够提高编码器的表征能力和泛化能力，从而提高识别模型的识别准确度。CN113723341ACN113723341A权利要求书1/2页1.一种视频的识别方法，其特征在于，所述方法包括：对获取到的待处理视频进行预处理，以得到目标视频；将所述目标视频输入预先训练的识别模型，以得到所述识别模型输出的识别结果，所述识别结果用于表征所述待处理视频的类别；所述识别模型包括编码器和投射层；所述编码器为根据多个预投射层和第一数量个预训练视频，预训练得到的，每个所述预投射层用于提取所述预训练视频的一种视频特征；所述识别模型为根据经过预训练的所述编码器，和第二数量的训练视频训练得到的，所述第二数量小于所述第一数量，所述预训练视频不具有用于指示类别的类别标签。2.根据权利要求1所述的方法，其特征在于，所述将所述目标视频输入预先训练的识别模型，以得到所述识别模型输出的识别结果，包括：通过所述编码器对所述目标视频进行编码，以得到所述目标视频对应的编码向量；通过所述投射层将所述编码向量投射为视频向量，所述视频向量的维度，与待选类别的数量相同，所述待处理视频的类别属于所述待选类别；根据所述视频向量确定所述识别结果。3.根据权利要求1所述的方法，其特征在于，所述编码器是通过如下方式预训练获得的：对第一数量个所述预训练视频进行预处理，以得到每个所述预训练视频对应的目标预训练视频；将每个所述目标预训练视频输入所述编码器，并将所述编码器的输出，输入多个所述预投射层，以得到每个所述预投射层提取的，该目标预训练视频的一种视频特征；根据每个所述目标预训练视频的多种视频特征，预训练所述编码器和多个所述预投射层。4.根据权利要求3所述的方法，其特征在于，所述根据每个所述目标预训练视频的多种视频特征，预训练所述编码器和多个所述预投射层，包括：针对每种视频特征，根据每两个所述目标预训练视频的该种视频特征，确定该种视频特征对应的损失；根据每种视频特征对应的损失确定综合损失；以降低所述综合损失为目标，利用反向传播算法预训练所述编码器和多个所述预投射层。5.根据权利要求1所述的方法，其特征在于，所述识别模型是通过如下方式训练获得的：对第二数量个所述训练视频进行预处理，以得到每个所述训练视频对应的目标训练视频；将每个所述目标训练视频输入所述识别模型，并根据所述识别模型的输出与该目标训练视频对应的所述训练视频的类别标签，训练所述识别模型。6.根据权利要求5所述的方法，其特征在于，所述将每个所述目标训练视频输入所述识别模型，并根据所述识别模型的输出与该目标训练视频对应的所述训练视频的类别标签，训练所述识别模型，包括：将该目标训练视频输入经过预训练的所述编码器，以得到经过预训练的所述编码器输2CN113723341A权利要求书2/2页出的，该目标训练视频对应的训练编码向量；将所述训练编码向量输入所述投射层，以得到所述投射层输出的训练视频向量；将所述训练视频向量输入所述识别模型的分类层，以得到所述分类层输出的训练识别结果，并将所述训练识别结果作为所述识别模型的输出；根据所述训练识别结果和该目标训练视频对应的所述训练视频的类别标签，训练所述投射层，和/或所述编码器。7.根据权利要求6所述的方法，其特征在于，所述识别模型还通过如下方式训练获得的：根据待选类别的数量，确定所述投射层的输出维度，以使所述投射层输出的所述训练视频向量的维度与所述待选类别的数量相同；所述待处

相关资料

视频的识别方法、装置、可读介质和电子设备.pdf

本公开涉及一种视频的识别方法、装置、可读介质和电子设备，涉及图像处理技术领域，该方法包括：对获取到的待处理视频进行预处理，以得到目标视频，将目标视频输入预先训练的识别模型，以得到识别模型输出的识别结果，识别结果用于表征待处理视频的类别；识别模型包括编码器和投射层，编码器为根据多个预投射层和第一数量个预训练视频，预训练得到的，每个预投射层对应一个时序范围，该预投射层用于提取预训练视频中对应的时序范围内的视频帧的特征，投射层为根据经过预训练的编码器，和第二数量的训练视频训练得到的，第二数量小于第一数量，第一样

2023-07-25

908KB

视频的识别方法、装置、可读介质和电子设备.pdf

本公开涉及一种视频的识别方法、装置、可读介质和电子设备，涉及图像处理技术领域，该方法包括：对获取到的待处理视频进行预处理，以得到目标视频，将目标视频输入预先训练的识别模型，以得到识别模型输出的识别结果，识别结果用于表征待处理视频的类别；识别模型包括编码器和投射层，编码器为根据多个预投射层和第一数量个预训练视频，预训练得到的，每个预投射层用于提取预训练视频的一种视频特征，识别模型为根据经过预训练的编码器，和第二数量的训练视频训练得到的，第二数量小于第一数量，预训练视频不具有用于指示类别的类别标签。本公开中能

2023-07-25

828KB

视频识别方法、装置、可读介质及电子设备.pdf

本公开涉及一种视频识别方法、装置、可读介质及电子设备，该方法包括：响应于针对待发布视频的发布请求，对待发布视频中的关键帧进行盲水印的提取操作；针对提取到盲水印信息的关键帧，识别盲水印信息中的第一唯一识别码，并根据第一唯一识别码，确定关键帧对应的视频片段是否为原创视频片段；根据关键帧对应的视频片段是否为原创视频片段的确定结果，确定待发布视频的原创性特征信息，原创性特征信息用于指示待发布视频是完全原创视频、非原创视频还是部分原创视频。通过上述技术方案，根据盲水印信息中的第一唯一识别码可准确回溯视频片段的最初原

2023-06-27

703KB

视频处理方法、装置、电子设备和可读介质.pdf

本申请提供了一种视频处理方法、装置、电子设备和可读介质，涉及网络技术领域。所述方法包括：提供交互页面，交互页面包括视频上传控件；依据对视频上传控件的触发，获取至少一种视频相关数据；至少一种视频相关数据包括目标视频数据；从至少一种视频相关数据中，确定用于过滤的至少两种模态的筛选数据，并依据至少两种模态的筛选数据对目标视频数据中的视频帧进行过滤，获得待拆条视频；基于预训练的视频拆分模型中的至少两个子拆分模型，分别获取待拆条视频的视频特征；其中，不同的子拆分模型获取的视频特征不完全相同；基于视频特征，将待拆条视

2023-07-25

944KB

视频行人重识别方法、装置、电子设备及可读存储介质.pdf

本申请公开了一种视频行人重识别方法、装置、电子设备及计算机可读存储介质，用于克服因场景变化带来的目标特性跨域差异，提高行人重识别准确率。该方法包括：获取待处理行人序列，并使用每个图像帧的相关滤波器，从待处理行人序列中选取多个具有强判别信息的目标序列片段；提取各个目标序列片段的特征，并依此得到待处理行人序列的特征；基于各片段的特征计算待处理行人序列和参考行人序列之间的距离向量，并根据各个距离向量，获得待处理行人序列的差异性描述子；分别计算待处理行人序列的特征、差异性描述子和检索库中各个目标行人序列的特征、差

2023-07-25

1MB