预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共36页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113852832A(43)申请公布日2021.12.28(21)申请号202011357523.3H04N21/44(2011.01)(22)申请日2020.11.26H04N21/478(2011.01)H04N21/4788(2011.01)(71)申请人阿里巴巴集团控股有限公司地址英属开曼群岛大开曼资本大厦一座四层847号邮箱(72)发明人徐良鹏王莽唐铭谦(74)专利代理机构北京润泽恒知识产权代理有限公司11319代理人钱秀茹(51)Int.Cl.H04N21/2187(2011.01)H04N21/233(2011.01)H04N21/234(2011.01)H04N21/254(2011.01)H04N21/439(2011.01)权利要求书4页说明书22页附图9页(54)发明名称视频处理方法、装置、设备和存储介质(57)摘要本申请实施例提供了一种视频处理方法、装置、设备和存储介质,以快速定位视频中的商品对象。所述方法包括:对所述视频数据的音频数据进行文本识别,确定包含商品对象的目标视频片段;将所述目标视频片段与关联的商品列表进行匹配,确定至少一个目标商品对象;对所述目标视频片段进行分析,确定第一商品特征;通过所述商品列表中的商品信息,确定商品对象的第二商品特征;将所述第一商品特征和目标商品对象对应的第二商品特征进行相似度匹配,确定匹配的商品对象;依据所述匹配的商品对象和对应的目标视频片段,对所述视频数据进行锚点。在后续的审核中可基于锚点快速跳转到相应的片段,提高处理效率。CN113852832ACN113852832A权利要求书1/4页1.一种视频处理方法,其特征在于,所述方法包括:对所述视频数据的音频数据进行文本识别,确定包含商品对象的目标视频片段;将所述目标视频片段与关联的商品列表进行匹配,确定至少一个目标商品对象;对所述目标视频片段进行分析,确定第一商品特征;通过所述商品列表中的商品信息,确定商品对象的第二商品特征;将所述第一商品特征和目标商品对象对应的第二商品特征进行相似度匹配,确定匹配的商品对象;依据所述匹配的商品对象和对应的目标视频片段,对所述视频数据进行锚点。2.根据权利要求1所述的方法,其特征在于,所述对所述视频数据的音频数据进行文本识别,确定包含商品对象的目标视频片段,包括:从所述视频数据中提取音频数据,对所述音频数据进行语音识别,获取对应的文本信息;依据所述文本信息对所述视频数据进行划分,确定包含商品对象的多个目标视频片段。3.根据权利要求2所述的方法,其特征在于,所述依据所述文本信息对所述视频数据进行划分,确定包含商品对象的多个目标视频片段,包括:依据所述文本信息定位商品对象对应的多个时间信息;依据所述多个时间信息,分别提取所述商品对象对应的目标视频片段。4.根据权利要求1所述的方法,其特征在于,将所述目标视频片段与关联的商品列表进行匹配,确定至少一个目标商品对象,包括:将所述目标视频片段对应的文本信息与关联的商品列表进行匹配,确定至少一个目标商品对象,作为文本召回结果;将所述目标视频片段中商品对象的图像与关联的商品列表进行匹配,确定至少一个目标商品对象,作为视觉召回结果。5.根据权利要求4所述的方法,其特征在于,所述将所述目标视频片段对应的文本信息与关联的商品列表进行匹配,确定至少一个目标商品对象,作为文本召回结果,包括:获取所述目标视频片段对应的文本信息,并提取文本特征;将所述文本特征与所述商品列表中商品对象的商品标题进行匹配,确定至少一个目标商品对象;将所述至少一个目标商品对象的对象标识作为文本召回结果。6.根据权利要求4所述的方法,其特征在于,所述将所述目标视频片段中商品对象的图像与关联的商品列表进行匹配,确定至少一个目标商品对象,作为视觉召回结果,包括:从所述目标视频片段中提取至少一个包含商品对象的第一图像;将所述第一图像与所述关联的商品列表中商品对象的第二图像进行匹配,确定至少一个目标商品对象;将所述至少一个目标商品对象的对象标识作为视觉召回结果。7.根据权利要求4所述的方法,其特征在于,还包括:将所述文本召回结果和视觉召回结果进行融合,确定所述目标视频片段对应的至少一个目标商品对象。2CN113852832A权利要求书2/4页8.根据权利要求1所述的方法,其特征在于,对所述目标视频片段进行分析,确定第一商品特征,包括:从所述目标视频片段中提取商品对象的第三商品特征,所述第三商品特征包括:语音文本特征和/或视觉图像特征;将所述第三商品特征进行融合处理,得到对应的第一商品特征。9.根据权利要求1所述的方法,其特征在于,所述通过所述商品列表中的商品信息,确定商品对象的第二商品特征,包括:获取所述商品列表中商