预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113989844A(43)申请公布日2022.01.28(21)申请号202111273933.4G06N3/04(2006.01)(22)申请日2021.10.29G06N3/08(2006.01)(71)申请人南京理工大学地址210094江苏省南京市玄武区孝陵卫200号(72)发明人李军付孟祥刘江余瑞欣鲍雯(74)专利代理机构南京理工大学专利中心32203代理人朱炳斐(51)Int.Cl.G06V40/10(2022.01)G06K9/62(2022.01)G06V10/40(2022.01)G06V10/774(2022.01)权利要求书4页说明书9页附图2页(54)发明名称一种基于卷积神经网络的行人检测方法(57)摘要本发明公开了一种基于卷积神经网络的行人检测方法,涉及计算机视觉中的深度学习领域,该方法利用卷积神经网络检测出行人,可以根据检测目标的尺寸不同动态的选择训练分支,得到更加准确的行人特征描述,无需手动设计行人特征,并且其检测准确率较高,检测速度较快,省时省力,可以应用在自动驾驶,辅助驾驶系统,安保系统以及机器人等多个领域,并且因为其基于深度学习方法,可以根据不同的应用场景获取不同的行人数据集进行训练,使其能够适用多种不同的领域,并且保持较高的检测准确率。CN113989844ACN113989844A权利要求书1/4页1.一种基于卷积神经网络的行人检测方法,其特征在于,所述方法包括以下步骤:步骤A,采集行人图像数据集且进行预处理,并将数据集按照预设比例划分为训练集以及测试集;步骤B,构建卷积神经网络模型,并对模型中的参数进行初始化设置;步骤C,标注训练集图像中目标的尺寸,利用训练集训练所述卷积神经网络模型;步骤D,利用训练好的深度卷积神经网络模型检测行人,得到准确位置的行人检测框。2.根据权利要求1所述的基于卷积神经网络的行人检测方法,其特征在于,步骤A中所述预处理包括高斯滤波以及归一化处理,具体过程包括:步骤A1a,将行人图像数据集中图像的大小统一设置为512x512,对图像进行高斯滤波,所用公式为:式中,(x,y)为图像中点的坐标,σ为标准差;步骤A1b,对图像中的每一个像素进行归一化,所用公式为:式中,(i,j)表示图像中像素的位置,xij表示位置(i,j)的像素值,xmin、xmax分别表示图像中像素的最小值与最大值。3.根据权利要求1或2所述的基于卷积神经网络的行人检测方法,其特征在于,步骤B所述构建卷积神经网络模型,并对模型中的参数进行初始化设置,具体过程包括:步骤B1,构建用于提取行人图像中的特征的特征提取网络,并对其进行参数初始化;步骤B2,构建用于对不同尺寸的目标的图像分别进行处理的特征提取分支网络,并对其进行参数初始化;步骤B3,构建行人回归网络,并对其进行参数初始化。4.根据权利要求3所述的基于卷积神经网络的行人检测方法,其特征在于,步骤B1中所述特征提取网络具体包括依次连接的:第一卷积层、最大池化层、三个相同的第一残差模块、四个相同的第二残差模块、六个相同的第三残差模块、以及三个相同的第四残差模块,网络的输入与第一残差模块的输出相连;所述第一卷积层的卷积核大小为7×7、通道数为64、步长为2,最大池化层的卷积核为3×3、步长为2;所述第一残差模块包括依次连接的卷积核为1×1、通道数为64的卷积层,卷积核为3×3、通道数为64的卷积层,以及卷积核为1×1、通道数为256的卷积层;所述第二残差模块包括依次连接的卷积核为1×1、通道数为128的卷积层,卷积核为3×3,通道数为128的卷积层,以及卷积核为1×1、通道数为512的卷积层;所述第三残差模块包括依次连接的卷积核为1×1、通道数为256的卷积层,卷积核为3×3、通道数为256的卷积层,以及卷积核为1×1、通道数为1024的卷积层;所述第四残差模块包括依次连接的卷积核为1×1、通道数为512的卷积层,卷积核为3×3、通道数为512的卷积层,以及卷积核为1×1,通道数为2048的卷积层;对所述特征提取网络进行参数初始化,具体包括:(1)设置残差模块参数,卷积层参数以及池化层参数,其中残差模块的前向传播公式如2CN113989844A权利要求书2/4页式(3)所示:其中,xL表示残差模块的输出,xl表示残差模块的输入,表示对输入进行卷积操作,F(·)表示卷积函数,Wi表示卷积结构的待训练参数;残差模块的逆向传播公式如式(4)所示:卷积层的前向传播公式如式(5)所示:式中,f表示激励函数,l表示层数,m和n表示上一层和当前层上特征图的映射编号,表示当前第l层的第n个特征图,表示第l‑1层的第m个特征图,表示第l层的第n个特征图与第l‑1层的第m个特征图之间相关的卷