预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN116012891A(43)申请公布日2023.04.25(21)申请号202310149814.0G06V10/82(2022.01)(22)申请日2023.02.16G06N3/08(2023.01)G06N3/0464(2023.01)(71)申请人平安科技(深圳)有限公司地址518000广东省深圳市福田区福田街道福安社区益田路5033号平安金融中心23楼(72)发明人盛建达童欣徐玲玲叶明戴磊陈远旭(74)专利代理机构深圳市赛恩倍吉知识产权代理有限公司44334专利代理师陈敬华(51)Int.Cl.G06V40/10(2022.01)G06V10/764(2022.01)G06V10/774(2022.01)权利要求书3页说明书16页附图3页(54)发明名称基于图像增强的多尺度行人检测方法、装置、设备及介质(57)摘要本申请提出一种基于图像增强的多尺度行人检测方法、装置、电子设备及存储介质,基于图像增强的多尺度行人检测方法包括:对采集到的行人图像集进行标记获得行人图像标签集;对所述行人图像集中的图像进行检测获得行人预测图像集;基于所述行人预测图像集和所述行人图像标签集构建行人识别损失函数;基于所述行人图像集、行人图像标签集和所述行人识别损失函数对所述多尺度行人初始检测模型进行训练获得多尺度行人优化检测模型;基于所述多尺度行人优化检测模型对包含行人的待检测图像进行检测获得多尺度行人真实图像集。本申请通过构建行人识别损失函数并结合图像增强技术来训练获得多尺度行人优化检测模型,可以有效提高对行人检测的准确度。CN116012891ACN116012891A权利要求书1/3页1.一种基于图像增强的多尺度行人检测方法,其特征在于,所述方法包括:采集多张包含行人的图像获得行人图像集,并对所述包含行人的图像进行标记获得行人图像标签集;依据预设的多尺度行人初始检测模型对所述行人图像集中的图像进行检测获得行人预测图像集;基于所述行人预测图像集和所述行人图像标签集构建行人识别损失函数;基于所述行人图像集、行人图像标签集和所述行人识别损失函数对所述多尺度行人初始检测模型进行训练获得多尺度行人优化检测模型;基于所述多尺度行人优化检测模型对包含行人的待检测图像进行检测获得多尺度行人真实图像集。2.如权利要求1所述的基于图像增强的多尺度行人检测方法,其特征在于,所述采集多张包含行人的图像获得行人图像集,并对所述包含行人的图像进行标记获得行人图像标签集,包括:采集多张包含行人的图像作为行人图像集;依据预设方式对所述行人图像集中各图像上的行人进行包围框标记得到行人图像标签集。3.如权利要求1所述的基于图像增强的多尺度行人检测方法,其特征在于,所述基于所述行人预测图像集和所述行人图像标签集构建行人识别损失函数包括:基于所述行人预测图像集中各图像上的行人包围框和所述行人图像标签集中各图像上的行人包围框构建边界框损失函数和置信度损失函数;对所述边界框损失函数和所述置信度损失函数求和后作为行人识别损失函数。4.如权利要求3所述的基于图像增强的多尺度行人检测方法,其特征在于,所述基于所述行人预测图像集中各图像上的行人包围框和所述行人图像标签集中各图像上的行人包围框构建边界框损失函数和置信度损失函数,包括:分别计算目标预测包围框和目标标签包围框的宽度、高度和中心点坐标,本方案中将所述行人预测图像集中第t幅图像上第n个行人包围框作为所述目标预测包围框,所述目标标签包围框为所述行人图像标签集中与所述目标预测包围框在位置上相对应的包围框;计算所述目标预测包围框和所述目标标签包围框的交并比和中心点之间的欧氏距离;基于所述宽度、高度、交并比和中心点之间的欧氏距离构建边界框损失函数;统计所述目标预测包围框和所述目标标签包围框的类别置信度;基于所述类别置信度构建置信度损失函数。5.如权利要求4所述的基于图像增强的多尺度行人检测方法,其特征在于,所述边界框损失函数满足关系式:2CN116012891A权利要求书2/3页其中,T表示所述行人预测图像集中图像的数量,Nt表示所述行人图像标签集中第t幅图像上的行人包围框的数量,α为所述目标预测包围框和所述目标标签包围框的交并比,v为超参数,ρ表示所述目标预测包围框和所述目标标签包围框的中心点之间的欧氏距离,Ch、Cw和c分别表示能够覆盖所述目标预测包围框和所述目标标签包围框的最小矩形的高度、宽度和对角线长度,和分别表示行人预测图像集和行人图像标签集中第t幅图像上第n个目标预测包围框和对应的目标标签包围框中的对角线长度,和分别表示行人预测图像集和行人图像标签集中第t幅图像上第n个目标预测包围框和对应的目标标签包围框的高度,和分别表示行人预测图像集和行人图像标签集中第t幅图像上