预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114973064A(43)申请公布日2022.08.30(21)申请号202210464331.5(22)申请日2022.04.29(71)申请人华为技术有限公司地址518129广东省深圳市龙岗区坂田华为总部办公楼(72)发明人万方邵滨廖明祥许松岑叶齐祥(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309专利代理师郭建凯陈霁(51)Int.Cl.G06V20/40(2022.01)G06V10/46(2022.01)G06V10/764(2022.01)权利要求书3页说明书13页附图4页(54)发明名称一种伪标签框生成方法、装置及电子设备(57)摘要本申请提供了一种伪标签框生成方法、装置及电子设备,涉及人工智能技术领域。该方法可以基于目标图像中目标的类别的数量,获取到与该数量相等数量的注意力图,且每个注意力图上均可以显著性的呈现出目标图像中属于同一类别的至少一个目标,并由获取到的注意力图,可以得到目标图像中各个目标的伪标签框。由于获取到的注意力图的数量是有限的,因此由注意力图得到的候选框的数量也是有限的,从而使得不需要枚举密集的、冗余的且低精度的伪标签框,从而可以便于后续的目标检测模型训练,提升目标检测精度。CN114973064ACN114973064A权利要求书1/3页1.一种伪标签框生成方法,其特征在于,所述方法包括:确定目标图像中各个目标的类别,以得到N个类别;基于所述N个类别,对所述目标图像进行处理,以得到N个注意力图,其中,每个所述注意力图均与所述N个类别中的一个类别相关联,每个所述注意力图均用于呈现所述目标图像中一个类别的目标;基于所述N个注意力图,得到所述目标图像中各个目标的伪标签框。2.根据权利要求1所述的方法,其特征在于,所述对所述目标图像进行处理,以得到N个注意力图,具体包括:基于C个第一标记,并通过注意力机制,对所述目标图像中进行处理,以得到C个注意力图和C个类别的分类得分,每个所述第一标记均用于对一个类别的语义进行学习,C≥N;基于所述C个类别的分类得分,从所述C个注意力图中筛选出所述N个注意力图,其中,与所述N个注意力图相关联的每个类别的分类得分均高于预设分数阈值。3.根据权利要求1或2所述的方法,其特征在于,所述基于所述N个注意力图,得到所述目标图像中各个目标的伪标签框之后,所述方法还包括:针对任意一个伪标签框,调整所述任意一个伪标签框在至少一个方向上的尺寸,以得到目标伪标签框,所述目标伪标签框内包含有一个完整的目标。4.根据权利要求1‑3任一所述的方法,其特征在于,所述基于所述N个注意力图,得到所述目标图像中各个目标的伪标签框,具体包括:对所述N个注意力图中的每个注意力图均进行二值化处理,并利用连通域的方式对二值化处理后的图像进行处理,得到所述目标图像中各个目标的伪标签框。5.根据权利要求1‑4任一所述的方法,其特征在于,所述方法还包括:对所述目标图像中所包含的目标进行检测,以得到预测标签框集合,所述预测标签框集合中包括所述目标图像中各个目标的预测标签框;基于伪标签框集合和所述预测标签框集合,对目标检测模型进行训练,所述伪标签框集合中包括所述目标图像中各个目标的伪标签框。6.根据权利要求5所述的方法,其特征在于,所述基于伪标签框集合和所述预测标签框集合,对目标检测模型进行训练,具体包括:基于所述伪标签框集合中的各个伪标签框,从所述预测标签框集合中选取x个预测标签框,x的取值与所述伪标签框的数量相等,所述x个预测标签框中的中每个标签框均与所述伪标签框集合中的一个伪标签框相关联;基于所述伪标签框集合中的伪标签框和所述x个预测标签框,更新所述目标检测模型中第一网络和第二网络的网络参数,所述第一网络用于得到所述伪标签框集合,所述第二网络用于得到所述预测标签框集合。7.一种伪标签框生成装置,其特征在于,所述装置包括:确定模块,用于确定目标图像中各个目标的类别,以得到N个类别;处理模块,用于基于所述N个类别,对所述目标图像进行处理,以得到N个注意力图,其中,每个所述注意力图均与所述N个类别中的一个类别相关联,每个所述注意力图均用于呈现所述目标图像中一个类别的目标;所述处理模块,还用于基于所述N个注意力图,得到所述目标图像中各个目标的伪标签2CN114973064A权利要求书2/3页框。8.根据权利要求7所述的装置,其特征在于,所述处理模块在对所述目标图像进行处理,以得到N个注意力图时,具体用于:基于C个第一标记,并通过注意力机制,对所述目标图像中进行处理,以得到C个注意力图和C个类别的分类得分,每个所述第一标记均用于对一个类别的语义进行学习,C≥N;基于所述C个类别的分类得分,从所述C个注意力图中筛选出所述N个注意力图,其中,