预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共39页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113806582A(43)申请公布日2021.12.17(21)申请号202111359989.1(22)申请日2021.11.17(71)申请人腾讯科技(深圳)有限公司地址518044广东省深圳市南山区高新区科技中一路腾讯大厦35层(72)发明人郭卉(74)专利代理机构北京同达信恒知识产权代理有限公司11291代理人朱佳(51)Int.Cl.G06F16/583(2019.01)权利要求书4页说明书25页附图9页(54)发明名称图像检索方法、装置、电子设备和存储介质(57)摘要本申请提供一种图像检索方法、装置、电子设备和存储介质,涉及计算机技术领域,可应用于云技术、人工智能、智慧交通、辅助驾驶等各种场景。方法包括:基于查询图像的目标基础特征,召回与查询图像具有相似基础特征的第一图像集合;基于查询图像的目标语义特征,从第一图像集合中选择与查询图像具有相似语义特征的多个候选图像;分别基于多个候选图像各自的语义特征,召回与相应候选图像具有相似语义特征的第二图像集合;基于召回的多个第二图像集合以及第一图像集合,确定检索到的目标图像集合。本申请采用二级召回方式,可以提高检索召回率,进而提高检索结果的准确性。CN113806582ACN113806582A权利要求书1/4页1.一种图像检索方法,其特征在于,包括:获取查询图像的目标基础特征和目标语义特征;其中,所述目标基础特征用于表征所述查询图像的无语义特征;召回第一图像集合;所述第一图像集合包含的各个图像各自的基础特征,与所述目标基础特征的基础相似度满足第一预设条件;从所述第一图像集合中选择多个候选图像;所述多个候选图像各自的语义特征,与所述目标语义特征的语义相似度满足第二预设条件;分别基于所述多个候选图像各自的语义特征,召回相应的第二图像集合;每个第二图像集合包含的各个图像,与相应候选图像的语义特征之间的语义相似度满足第三预设条件;基于召回的多个第二图像集合以及所述第一图像集合,确定检索到的目标图像集合。2.根据权利要求1所述的方法,其特征在于,所述召回第一图像集合,包括:从图像库中的多个基础特征索引中,选择多个基础参考索引;每个基础特征索引为关联的多个基础特征的聚类中心,所述多个基础参考索引各自与所述目标基础特征的基础相似度不小于第一相似度阈值;获取所述多个基础参考索引各自关联的多个基础特征;根据获取的各个基础特征各自对应的图像,以及所述多个基础参考索引各自对应的图像,生成所述第一图像集合。3.根据权利要求1所述的方法,其特征在于,所述分别基于所述多个候选图像各自的语义特征,召回相应的第二图像集合,包括:针对所述多个候选图像,分别执行以下操作:从图像库中的多个语义特征索引中,选择多个语义参考索引;每个语义特征索引为关联的多个语义特征的聚类中心,选择的多个语义参考索引各自与一个候选图像的语义特征的语义相似度,不小于第二相似度阈值;获取所述多个语义参考索引各自关联的多个语义特征;根据获取的各个语义特征各自对应的图像,以及所述多个语义参考索引各自对应的图像,生成相应的第二图像集合。4.根据权利要求1至3任一项所述的方法,其特征在于,所述获取查询图像的目标基础特征和目标语义特征,包括:将所述查询图像输入已训练的图像特征提取模型,获得所述目标基础特征;所述图像特征提取模型基于三元组样本数据集训练获得,所述三元组样本数据集中的每个三元组样本包括基准图像、与所述基准图像相似的图像、与所述基准图像不相似的图像;将所述查询图像输入已训练的图像语义提取模型,获得所述目标语义特征;所述图像语义提取模型基于标注有物体类别的三元组样本数据集训练获得。5.根据权利要求4所述的方法,其特征在于,所述基于召回的多个第二图像集合以及所述第一图像集合,确定检索到的目标图像集合,包括:针对所述多个第二图像集合以及所述第一图像集合包含的各个图像,根据所述各个图像各自的基础特征与所述目标基础特征的基础相似度,以及所述各个图像各自的语义特征与所述目标语义特征的语义相似度,将所述各个图像进行排序;2CN113806582A权利要求书2/4页从排序后的各个图像中选择多个目标图像,获得检索到的目标图像集合。6.根据权利要求1至3任一项所述的方法,其特征在于,所述方法还包括:获取所述查询图像的目标类别信息,所述目标类别信息用于表征所述查询图像所包含的物体类别;召回第三图像集合;所述第三图像集合包含的各个图像各自的类别信息与所述目标类别信息相同;基于所述第三图像集合包含的多个参考图像各自的语义特征,召回相应的第四图像集合;每个第四图像集合包含的各个图像,与相应参考图像的语义特征之间的语义相似度满足第五预设条件;所述基于召回的多个第二图像集合以及所述第一图像