预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114267010A(43)申请公布日2022.04.01(21)申请号202111448871.6G06V10/74(2022.01)(22)申请日2021.11.30G06V10/75(2022.01)G06V10/774(2022.01)(71)申请人高新兴科技集团股份有限公司G06V10/80(2022.01)地址510530广东省广州市黄埔区科学城G06V10/82(2022.01)开创大道2819号六楼G06V10/764(2022.01)申请人西安电子科技大学G06K9/62(2022.01)(72)发明人王慧陈利军洪曙光王祥雪G06N3/04(2006.01)林焕凯刘双广G06N3/08(2006.01)(74)专利代理机构广州国鹏知识产权代理事务所(普通合伙)44511代理人葛红(51)Int.Cl.G06V20/52(2022.01)G06V20/54(2022.01)G06V10/40(2022.01)权利要求书2页说明书9页附图4页(54)发明名称多尺度机非人检测方法、装置、介质及设备(57)摘要本发明公开了一种多尺度机非人检测方法,包括:获取道路监控场景的图像训练集,对所述图像训练集中的训练样本进行预处理;采用预处理后的训练样本训练预设的机非人检测模型,所述机非人检测模型采用不同大小的四个预测尺度对输入图像进行机非人目标预测;获取道路监控场景的待预测图像,通过训练好的机非人检测模型提取所述待预测图像中的机非人目标特征;将所述机非人目标特征与道路监控场景图库中的特征信息进行匹配,得到所述待预测图像中的机非人目标的位置信息和分类信息。本发明在机非人检测模型的预测步骤中采用四个预测尺度,可以兼顾更小目标的检测,对大目标和小目标都有较好的检测效果,有效地提高了机非人检测的精确度和稳健性。CN114267010ACN114267010A权利要求书1/2页1.一种多尺度机非人检测方法,其特征在于,包括:获取道路监控场景的图像训练集,对所述图像训练集中的训练样本进行预处理,所述训练样本为已知机非人位置信息和分类信息的道路监控场景图像;采用预处理后的训练样本训练预设的机非人检测模型,所述机非人检测模型采用不同大小的四个预测尺度对输入图像进行机非人目标预测;获取道路监控场景的待预测图像,通过训练好的机非人检测模型提取所述待预测图像中的机非人目标特征,所述待预测图像为未知机非人位置信息和分类信息的道路监控场景图像;将所述机非人目标特征与道路监控场景图库中的特征信息进行匹配,得到所述待预测图像中的机非人目标的位置信息和分类信息。2.如权利要求1所述的多尺度机非人检测方法,其特征在于,所述对所述图像训练集中的训练样本进行预处理包括:将所述图像训练集中的训练样本调整为预设尺寸。3.如权利要求1所述的多尺度机非人检测方法,其特征在于,所述机非人检测模型包括主干网络和特征融合层;所述主干网络采用CSPDarknet53网络,包括依次首尾相连的第一阶段、第二阶段、第三阶段、第四阶段,所述第一阶段和第二阶段输出浅层特征,所述第三阶段和第四阶段输出深层特征,其中所述第一阶段输出的浅层特征比第二阶段输出的浅层特征更浅,所述第四阶段输出的深层特征比第三阶段输出的深层特征更深;所述特征融合层由CONV、upsample、BottleneckCSP组成,用于对主干网络中第四阶段输出的深层特征进行特征提取,分别得到不同层次的第一特征、第二特征、第三特征、第四特征、第五特征以及第六特征;对所述第二阶段输出的浅层特征和第二特征上采样后的特征、所述第三阶段输出的深层特征和第一特征上采样后的特征、所述第一阶段输出的浅层特征和第三特征上采样后的特征、所述第四阶段输出的深层特征和第六特征、第二特征和第五特征、第三特征和第四特征分别进行融合,得到不同尺度的融合特征;将所述不同尺度的融合特征中的后四个融合特征输入预测层,所述预测层采用大小不同的四预测尺度进行机非人目标预测,得到机非人目标特征。4.如权利要求3所述的多尺度机非人检测方法,其特征在于,所述大小不同的四个预测尺度包括16*16、32*32、64*64、128*128,其中16*16用于进行大目标预测,所述128*128用于进行小目标预测。5.如权利要求3或4所述的多尺度机非人检测方法,其特征在于,所述机非人检测模型的损失函数为边框回归损失函数、置信度损失函数和分类损失函数的加权和;所述边框回归损失函数采用CIOULoss和DistributionFocalLoss的和;所述置信度损失函数采用FocalLoss;所述分类损失函数采用多分类的FocalLoss。6.如权利要求1所述的多尺度机非人检测方法,其特征在于,所述将所述机