预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110942106A(43)申请公布日2020.03.31(21)申请号201911279242.8(22)申请日2019.12.13(71)申请人东华大学地址201600上海市松江区人民北路2999号(72)发明人卢婷杨贺群胡念妍刘国华郭文静(74)专利代理机构上海申汇专利代理有限公司31001代理人徐俊(51)Int.Cl.G06K9/62(2006.01)权利要求书1页说明书4页附图3页(54)发明名称一种基于平方平均的池化卷积神经网络图像分类方法(57)摘要本发明涉及一种基于平方平均的池化卷积神经网络图像分类方法。本发明采用梯度下降法对网络中的权值和阈值参数进行逐层的反向调节,以获取网络参数的最优解。其中池化层通过设定池化窗口的大小和步长的大小进行池化运算,目的是减小特征图维度,池化规模一般为2x2。虽然最大值池化能够更多地保留图像的纹理特征,却忽略了背景特征信息。因此在池化层中使用平方平均池化运算方法,对特征矩阵进行平方平均运算,通过平方平均运算更好的保留图像的纹理和背景特征。图像经过一系列卷积层池化层后,最后得到的是一系列的特征图,然后将这些特征图中的像素依次取出,融合成一个向量传给分类器。CN110942106ACN110942106A权利要求书1/1页1.一种基于平方平均的池化卷积神经网络图像分类方法,其特征在于,包括以下步骤:步骤1、将训练集输入到卷积层进行卷积运算,在卷积运算过程中对训练集中的图像进行特征提取,增强原图像信息并降低图像噪声;步骤2、将卷积层输出的训练集输入到3x3的最大池化层进行处理;步骤3、将最大池化层输出的训练集输入到密集连接块DenseBlock中,在密集连接块DenseBlock中采用密集连接的方式处理训练集中的特征图;步骤4、把密集连接块DenseBlock处理后的特征图输入过渡层中进行卷积和平方平均池化运算,通过平方平均池化运算进一步增强特征信号;步骤5、在通过一系列密集连接块DenseBlock和过渡层处理后,在最后的池化层进行7x7的全局平均池化,最终得到多个具有统一输出维度的特征矩阵;步骤6、把特征矩阵融合为输出特征向量,对输出特征向量进行分类;步骤7、对网络进行多次训练,调整中间参数,使输入输出的关系更加明显。2.如权利要求1所述的一种基于平方平均的池化卷积神经网络图像分类方法,其特征在于,步骤1中,所述卷积层采用的卷积公式如式(1)所示:式(1)中,为第n层的输出特征,x和y分别为输出特征的长度和高度,为第n层的长度为x、高度为y的感受野;为第n-1层的输出特征,其为第n层的输入特征;wn为权重;bn为置偏;f为激活函数,如式(2)所示:3.如权利要求1所述的一种基于平方平均的池化卷积神经网络图像分类方法,其特征在于,步骤3中,所述密集连接块DenseBlock使用非线性组合函数Hl(·),非线性组合函数Hl(·)包含BN、ReLU、3x3卷积,在每个密集连接块DenseBlock中在经过各个层的卷积之后均输出k个特征图,即采用k个卷积核,k为增长率。4.如权利要求1所述的一种基于平方平均的池化卷积神经网络图像分类方法,其特征在于,步骤3中,所述密集连接块DenseBlock中的密集连接具体实现为:将第一层收到的前边所有的特征图,作为其输入,然后用式(3)完成密集连接操作:Xl=Hl([x0,x1,…,xl-1])(3)式(3)中,[x0,x1,…,xl-1]代表对第0层到(l-1)层的特征图进行拼接操作,Xl表示第l层的输入。2CN110942106A说明书1/4页一种基于平方平均的池化卷积神经网络图像分类方法技术领域[0001]本发明涉及一种神经网络图像分类的改进方法,尤其涉及一种在池化层的改进从而提高图像分类精度的方法。背景技术[0002]现阶段,图像分类广泛应用于各个领域,比如目标识别、图像理解、基于内容的图像检索等。近年来,随着深度学习在图像处理领域获得突破性进展,利用深度学习进行图像分类已成为一项研究热点。[0003]第一个卷积神经网络是1987年由AlexanderWaibel等提出的时间延迟网络,它被用于语音识别问题。随着技术的发展,卷积神经网络被逐步改进,并应用于计算机视觉领域。卷积神经网络是一类包含卷积计算且具有深度结构的前馈神经网络,是一种多层的监督学习神经网络,通过权值共享和卷积运算直接处理二维图像。其基本结构是一系列交替连接的卷积层和池化层以及一个全连接的输出层,卷积神经网络中的三个关键操作为:局部感受野、权值共享和池化。[0004]在计算机视觉领域,卷积神经网络(CNN)已经成为最主流的方法,最常见的卷积神经网络模型有GoogLenet,VGG-19,Incepet