预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114140757A(43)申请公布日2022.03.04(21)申请号202111447950.5G06V10/82(2022.01)(22)申请日2021.11.30G06K9/62(2022.01)G06N3/04(2006.01)(71)申请人武汉理工大学G06N3/08(2006.01)地址430070湖北省武汉市洪山区珞狮路122号(72)发明人石英王昊谢长君华捷(74)专利代理机构武汉智嘉联合知识产权代理事务所(普通合伙)42231代理人李平丽(51)Int.Cl.G06V20/56(2022.01)G06V20/58(2022.01)G06V10/46(2022.01)G06V10/764(2022.01)G06V10/80(2022.01)权利要求书2页说明书10页附图5页(54)发明名称基于改进FCOS的道路场景多类别检测方法及系统(57)摘要一种基于改进FCOS的道路场景多类别检测方法,包括:首先对KITTI数据集预处理,将原本九个类别合并为三类;其次,提出跨尺度改进策略,新增P2层,放大最低层特征,并融合P3层语义信息;然后融合特征退化策略和重检测策略,以加深目标特征理解;提出IOU‑better策略,在用于边框回归的特征图上使用IOU预测网络替代Center‑ness网络;最后提出参数共享策略,通过共享head网络部分卷积层的特征提升算法实时性。CN114140757ACN114140757A权利要求书1/2页1.一种基于改进FCOS的道路场景多类别检测方法,其特征在于,包括如下步骤:S1、数据集预处理:根据道路场景下待检测目标的不同,将KITTI数据集中类别进行合并;S2、特征提取与融合:使用ResNet‑50网络进行特征提取,并对原FCOS算法采用的特征金字塔网络FPN算法的多尺度策略进行改进,新增P2层,放大最低层特征,并融合P3层语义信息,增加网络的多尺度表达能力;S3、针对道路场景各类别之间特征模糊的问题以及检测时出现偶然性误差的情况,使用特征退化策略与重检测策略,完成对多任务输出子网络Head的检测,同时从边框回归分支获得目标预测边界框Bbox(Boundingbox)输出;S4、使用直接表示预测框定位精度的交并比IOU(IntersectionoverUnion)预测值代替中心度Center‑ness预测值对分类分数进行约束,并将IOU预测分支添加在边框回归分支上,构成IOU预测子网络,预测框与真值框的IOU值越大则认为其定位质量越高;S5、通过共享卷积层的参数,并通过非极大值抑制NMS完成后处理操作得到最终结果。2.如权利要求1所述的基于改进FCOS的道路场景多类别检测方法,其特征在于,所述步骤S1包括:S11、类别合并:对KITTI数据集中类别进行合并,合并策略为小型客运汽车Car、厢式货车Van、皮卡车Truck、有轨电车Tram合为一类,记为Car;行人Pedestrian、坐轮椅的行人Person_sitting合为一类,记为行人类别Person;骑自行车的行人Cyclist自成一类;忽略杂项Misc和表示该区域没有被标注的DontCare;S12、图像大小调整:对KITTI数据集中的所有图像进行调整,使所有图像最短边小于第一预设值,最长边小于第二预设值。3.如权利要求1所述的基于改进FCOS的道路场景多类别检测方法,其特征在于,所述步骤S2包括:S21、对于ResNet‑50网络:采用ResNet‑50网络进行特征提取,ResNet‑50采用残差结构,其内部的残差块使用跳跃连接;对输入的图像,进行多次卷积和下采样操作逐级减小特征图分辨率;步骤S22、跨尺度改进策略进行特征融合:提出AM‑FPN跨尺度改进策略,将骨干网络输出层数由3层上升为4层,得到了包含更多极小目标特征的高分辨率的C2层,并融合P3层的语义信息得到更利于检测极小目标的P2层;将道路场景下待检测目标划分成6类,大小为{(0,32],[32,64],[64,128],[128,256],[256,512],[512,+∞)}的目标分别在{P2,P3,P4,P5,P6,P7}层上进行检测。4.如权利要求3所述的基于改进FCOS的道路场景多类别检测方法,其特征在于,所述步骤S3包括:S31、特征退化策略:所述特征退化策略为每个类别单独设计分类特征提取分支,通过H×W×256的卷积层提取各类别差异特征,其中H指通道高度、W指通道宽度、256指通道数;在每个分类特征上仅进行其对应的类别分类任务得到H×W×L的特征层,之后将各类别分类结果融合得到最终的道路场景目标分类任务,得到H×W×3的特征层;S32、重检测策略:所述重检测策略为在原有H×W×