预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113705583A(43)申请公布日2021.11.26(21)申请号202110935817.8(22)申请日2021.08.16(71)申请人南京莱斯电子设备有限公司地址210000江苏省南京市秦淮区永丰大道36号天安数码城05幢(72)发明人朱伟张胜男刘羽吉咸阳蒋立飞张典辛付豪(74)专利代理机构江苏圣典律师事务所32237代理人于瀚文胡建华(51)Int.Cl.G06K9/46(2006.01)G06K9/62(2006.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书3页说明书8页附图3页(54)发明名称一种基于卷积神经网络模型的目标检测识别方法(57)摘要本发明提供了一种基于卷积神经网络模型的目标检测识别方法,首先构建Dense‑Spp‑Gaussion网络模型,以密集连接DenseNet网络为骨干网络,引入空间金字塔池化结构和多尺度检测,并采用Gaussian模型对网络输出进行建模,可以得到每个预测框的可靠性,提升检测精度,然后预测值与真实值之间的误差构建损失函数,迭代更新模型参数使得损失函数收敛,最后获得训练好的模型用于目标检测识别。本发明采用4种尺度检测,提高了对小目标的检出率,并用Gaussian模型对位置信息进行建模,得到定位准确度信息,提升了总的检测准确率。CN113705583ACN113705583A权利要求书1/3页1.一种基于卷积神经网络模型的目标检测识别方法,其特征在于,包括如下步骤:步骤1,构建Dense‑Spp‑Gaussion目标检测网络模型;步骤2,训练Dense‑Spp‑Gaussion目标检测网络模型直至损失函数收敛;步骤3,输入被检测目标图像,利用训练好的Dense‑Spp‑Gaussion目标检测网络模型检测图像中的目标,输出图像中每个目标的边界框位置、尺寸以及目标类别。2.根据权利要求1所述的方法,其特征在于,步骤1中,所述Dense‑Spp‑Gaussion目标检测网络模型,包括密集连接DenseNet网络、空间金字塔池化结构SPP、目标检测层和高斯模型,空间金字塔池化结构SPP用于融合多尺度图像局部区域特征,目标检测层对顶层特征图两次上采样,并与底层特征图进行融合。3.根据权利要求2所述的方法,其特征在于,步骤1中,所述DenseNet网络包括两个以上密集卷积块DenseBlock,单个密集卷积块DenseBlock中包括1个1×1的卷积核和4个3×3卷积核,每个3×3卷积核后还加入BatchNormalization批归一化层和Relu激活函数;密集卷积块DenseBlock的密集连接方式第L层的输出xl为:xl=Hl([x0,x1,…,xl‑1])其中,Hl表示非线性变换,[x0,x1,…,xl‑1]表示第0到L‑1层输出的特征做通道合并。4.根据权利要求3所述的方法,其特征在于,步骤1中,所述DenseNet网络中共有4个密集卷积块集合,4个密集卷积块集合中密集卷积块的数量分别为6、12、24、16,密集卷积块集合之间由转移层连接,转移层为大小为2×2、步长为2的卷积核进行均值池化;将4个密集卷积块集合产生的32倍、16倍、8和4倍降采样得到的4个不同尺度的特征图,分别为(13,13)、(26,26)、(52,52)、(104,104),在(13,13)特征图上引入空间金字塔池化结构SPP,融合多尺度图像局部区域特征,池化窗口尺寸Spool×Spool为:其中,Smap表示输入特征图尺寸,Spool表示池化操作后特征图尺寸,ni为缩小倍数,池化步长都为1,采用边界填充保证池化后特征图尺寸不变,然后将不同池化输出结果进行特征合并;经过32倍、16倍、8和4倍降采样得到的4个不同尺度的特征图输入4个不同的通道(y1,y2,y3,y4),其中经过空间金字塔池化结构SPP的(13,13)特征图输入y1通道;(13,13)特征图经过2倍上采样后与(26,26)特征图特征合并输入y2通道,同样合并后的(26,26)特征图经过2倍上采样后与(52,52)特征图特征合并输入y3通道,合并后的(52,52)特征图经过2倍上采样后与(104,104)特征图特征合并输入y4通道;增加高斯模型对4个通道的输出结果进行建模,模型输出为:S×S×(K*(9+N))S表示特征图尺寸,分别为104、52、26和13,K为4个不同尺寸特征图对应的先验框数量;9+N为每个网格预测的结果,具体如下所示:表示预测框的位置信息,分别为中心点的x坐标、y坐标、宽和高,2CN113705583A权利要求书2/3页分别为x坐标的标准差信息、y坐标的标准差信息、宽的标准差信息和高的标准差信息,用来估计