预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114399629A(43)申请公布日2022.04.26(21)申请号202111582867.9(22)申请日2021.12.22(71)申请人北京沃东天骏信息技术有限公司地址100176北京市北京经济技术开发区科创十一街18号院2号楼4层A402室(72)发明人刘安吕晶晶张政刘平(74)专利代理机构中原信达知识产权代理有限责任公司11219代理人李娜张效荣(51)Int.Cl.G06V10/25(2022.01)G06V10/774(2022.01)G06V10/82(2022.01)G06K9/62(2022.01)G06N3/04(2006.01)权利要求书3页说明书13页附图5页(54)发明名称一种目标检测模型的训练方法、目标检测的方法和装置(57)摘要本发明公开了一种目标检测模型的训练方法、目标检测的方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取多个图像和每个图像对应的图像标签,图像标签包括图像中目标的位置和类别,根据图像获得图像对应的特征向量和位置编码向量,根据特征向量和位置编码向量获得图像对应的解码向量,采用多个图像对应的解码向量和图像标签进行训练,得到目标检测模型。然后利用该目标检测模型预测待检测图像中目标的位置和类别。该实施方式通过卷积神经网络结合自注意力机制检测图像中目标的位置和类别,提高了目标检测的精度,简化了目标检测的流程。CN114399629ACN114399629A权利要求书1/3页1.一种目标检测模型的训练方法,其特征在于,包括:获取多个图像和每个所述图像对应的图像标签,所述图像标签包括所述图像中目标的位置和类别;根据所述图像获得所述图像对应的特征向量和位置编码向量;根据所述特征向量和所述位置编码向量获得所述图像对应的解码向量;采用多个所述图像对应的解码向量和图像标签进行训练,得到所述目标检测模型。2.根据权利要求1所述的训练方法,其特征在于,根据所述图像获得所述图像对应的特征向量和位置编码向量之前,还包括:从多个图像和每个所述图像对应的图像标签中选择出部分图像和每个图像对应的图像标签;根据所述部分图像和每个图像对应的图像标签训练得到图像检测模型;利用所述图像检测模型对所述多个图像和图像标签进行数据清洗,确定出待重新标注的图像标签,对所述待重新标注的图像标签进行重新标注。3.根据权利要求1所述的训练方法,其特征在于,根据所述图像获得所述图像对应的特征向量和位置编码向量之前,还包括:根据每个所述图像对应的图像标签确定每个类别对应的图像的数量;根据每个所述类别对应的图像的数量对部分类别的图像和图像标签进行数据增强。4.根据权利要求1所述的训练方法,其特征在于,根据所述图像获得所述图像对应的特征向量和位置编码向量,包括:提取所述图像的每个子区域的图像特征,根据各个子区域的图像特征得到所述图像对应的特征向量;根据各个子区域的图像特征获得所述图像对应的位置编码向量,所述位置编码向量包含所述图像对应的各个子区域的图像特征之间的位置关系。5.根据权利要求4所述的训练方法,其特征在于,提取所述图像的每个子区域的图像特征之前,包括:采用显著性检测模型检测出所述图像的前景区域;对所述前景区域按照不同尺度划分,获得所述图像对应的多个子区域。6.根据权利要求4所述的训练方法,其特征在于,提取每个子区域的图像特征,根据各个子区域的图像特征得到所述图像对应的特征向量,包括:利用包含特征金字塔网络的骨干特征提取网络提取每个子区域的图像特征,得到每个子区域对应的子区域特征向量,根据所述图像对应的各个子区域特征向量得到所述图像对应的特征向量。7.根据权利要求1所述的训练方法,其特征在于,根据所述特征向量和所述位置编码向量获得所述图像对应的解码向量,包括:根据所述特征向量和所述位置编码向量得到融合特征向量;基于自注意力机制的模型对所述融合特征向量进行特征编码和特征解码,得到所述解码向量。8.根据权利要求1所述的训练方法,其特征在于,采用多个所述图像对应的解码向量和图像标签进行训练,得到所述目标检测模型,包括:2CN114399629A权利要求书2/3页将各个图像对应的解码向量输入到共享前馈网络,得到各个图像对应的预测的目标的位置和类别,根据所述预测的目标的位置和类别以及各个图像的图像标签对损失函数进行迭代训练,得到所述目标检测模型,所述损失函数包括位置损失和类别损失。9.根据权利要求8所述的训练方法,其特征在于,所述目标的位置包括所述目标对应的目标框的中心坐标、宽度和高度,所述位置损失为根据预测目标框和真实目标框的交集面积和并集面积的比值得到的损失,所述类别损失为真实目标框集合和预测目标框集合的二分匹配排列的损失,所述共享前馈网络由