预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共27页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113705323A(43)申请公布日2021.11.26(21)申请号202110661352.1(22)申请日2021.06.15(71)申请人腾讯科技(深圳)有限公司地址518057广东省深圳市南山区高新区科技中一路腾讯大厦35层(72)发明人蔡德肖凯文叶虎马兆轩韩骁(74)专利代理机构北京三高永信知识产权代理有限责任公司11138代理人张所明(51)Int.Cl.G06K9/00(2006.01)G06K9/46(2006.01)G06K9/62(2006.01)G06N20/00(2019.01)权利要求书2页说明书19页附图5页(54)发明名称图像识别方法、装置、设备以及存储介质(57)摘要本申请公开了一种图像识别方法、装置、设备以及存储介质,属于计算机技术领域。通过本申请实施例提供的技术方案,在确定图像的类别时,考虑了不同对象对图像分类结果的影响,也即是结合了目标对象和参考对象对图像分类结果的影响,图像的图像特征是基于目标对象特征和参考对象特征确定的,这样得到的图像特征也就具有更强的表达能力,基于该图像特征来确定图像的类别时,就能够得到更为准确的结果。CN113705323ACN113705323A权利要求书1/2页1.一种图像识别方法,其特征在于,所述方法包括:获取待识别的图像,所述图像包括多个对象;对所述图像进行特征提取,得到多个对象特征,一个所述对象特征对应于一个所述对象;基于所述多个对象特征,从所述多个对象中确定出多个目标对象和多个参考对象,所述目标对象和所述参考对象为不同类别的对象;将多个目标对象特征和多个参考对象特征进行融合,得到所述图像的图像特征,所述目标对象特征为所述目标对象对应的对象特征,所述参考对象特征为所述参考对象对应的对象特征;基于所述图像特征,确定所述图像的类别。2.根据权利要求1所述的方法,其特征在于,所述基于所述多个对象特征,从所述多个对象中确定出多个目标对象和多个参考对象包括:基于所述多个对象特征,确定所述多个对象为所述目标对象的概率;将概率大于或等于第一概率阈值的多个对象确定为所述多个目标对象;将概率小于第二概率阈值的多个对象确定为所述多个参考对象,所述第一概率阈值大于所述第二概率阈值。3.根据权利要求2所述的方法,其特征在于,所述基于所述多个对象特征,确定所述多个对象为所述目标对象的概率包括:对所述多个对象特征进行全连接处理和归一化处理,得到所述多个对象为所述目标对象的概率。4.根据权利要求1所述的方法,其特征在于,所述将多个目标对象特征和多个参考对象特征进行融合,得到所述图像的图像特征包括:基于注意力机制,对对象特征集进行编码,得到所述图像的图像特征,所述对象特征集包括所述多个目标对象特征和所述多个参考对象特征。5.根据权利要求4所述的方法,其特征在于,所述基于注意力机制,对对象特征集进行编码,得到所述图像的图像特征包括:将所述对象特征集与第一变换矩阵相乘,得到所述图像的查询矩阵;将所述对象特征集与第二变换矩阵相乘,得到所述图像的键矩阵;将所述查询矩阵与转置后的所述键矩阵相乘,得到所述图像的注意力矩阵;将所述注意力矩阵与所述对象特征集相乘,得到所述图像的图像特征。6.根据权利要求1所述的方法,其特征在于,所述基于所述图像特征,确定所述图像的类别包括:对所述图像特征进行降维处理,得到降维后的所述图像特征;对所述降维后的所述图像特征进行归一化处理,得到所述图像属于不同类别的概率;基于所述概率,确定所述图像的类别。7.根据权利要求1所述的方法,其特征在于,所述对所述图像进行特征提取,得到多个对象特征包括:对所述图像进行卷积处理,得到所述图像对应的特征图;在所述特征图上确定多个目标区域,一个所述目标区域对应于一个所述对象;2CN113705323A权利要求书2/2页对所述多个目标区域对应的部分特征图进行池化处理,得到所述多个对象特征。8.根据权利要求7所述的方法,其特征在于,所述在所述特征图上确定多个目标区域包括:将所述特征图划分为多个待选区域;基于所述多个待选区域分别对应的部分特征图,确定所述多个待选区域对应于所述对象的概率;将概率大于或等于第三概率阈值的待选区域,确定为所述目标区域。9.根据权利要求1所述的方法,其特征在于,所述基于所述图像特征,确定所述图像的类别之后,所述方法还包括:显示所述图像的分类页面,所述分类页面上显示有所述图像、至少一个所述目标对象、至少一个所述参考对象以及所述图像的类别。10.根据权利要求9所述的方法,其特征在于,所述显示所述图像的分类页面之前,所述方法还包括:基于所述多个目标对象特征,确定所述多个目标对象的类别;所述显示所述图像的分类页面包括:在所述分类页面上显示所述至少一