预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110321967A(43)申请公布日2019.10.11(21)申请号201910624323.0(22)申请日2019.07.11(71)申请人南京邮电大学地址210012江苏省南京市雨花台区软件大道186号(72)发明人李跃辉赵诚诚(74)专利代理机构南京瑞弘专利商标事务所(普通合伙)32249代理人王路(51)Int.Cl.G06K9/62(2006.01)G06K9/46(2006.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书4页附图2页(54)发明名称基于卷积神经网络的图像分类改进算法(57)摘要本发明公开了一种基于卷积神经网络的图像分类的改进算法,采用AlexNet网络模型为基本框架,将输入图片先进行适当预处理及数据增强,以降低对网络对样本数量的依赖性,通过神经网络卷积层进行特征提取,再通过池化层保留主要特征,同时减少下一层的的参数和计算量,采用多尺度卷积的方法,使得网络模型不再限制输入图像的尺寸大小,采用LDA算法进一步对特征图进行进一步的降维,最后得到对图片的预测分类。本发明的基于卷积神经网络的图像分类改进算法可以降低网络模型对样本数量的依赖性,通过采用LDA算法以及采用多尺度卷积可以进一步降低参数数量,简化计算量,并且提高图片分类的准确率。CN110321967ACN110321967A权利要求书1/2页1.一种基于卷积神经网络的图像分类改进算法,其特征在于:具体包含如下步骤:步骤一:对输入图像进行图像增强、滤波和降噪预处理操作,以降低之后对图像特征提取的影响;步骤二:预处理之后得到的图像进行卷积操作,提取图像特征,并采用最大池化方法进行池化,提取接受域中值最大的像素点,舍弃其余像素点,得到的特征图在尺寸降低的同时还保留了图像的关键信息,减小卷积核尺寸,然后再次进行卷积池化操作,输出更加抽象的特征图;步骤三:将步骤二输出的经过池化卷积操作得到的特征图通过多个连续的卷积层进行卷积,将不同通道的特征进行充分的融合,并将该特征图送入到金字塔池化层进行池化;步骤四:将特征图通过多尺度卷积层进行卷积操作,这样就得到固定尺寸大小的特征图;步骤五:采用LDA方法对特征图进行近一步的降维与分类,利用LDA进行投影,将投影后的样本特征信息带入到概率密度函数中计算,得到概率分布信息,输出计算结果和预测类别。2.根据权利要求1所述的一种基于卷积神经网络的图像分类改进算法,其特征在于:步骤一中,对于输入图像进行高斯滤波,以抑制噪声,平滑图像,并同时对图像进行翻转、色彩、饱和以及对比度进行调整。3.根据权利要求1所述的一种基于卷积神经网络的图像分类改进算法,其特征在于:步骤三中共使用了四层连续的卷积层对图像的不同通道的特征进行充分融合。4.根据权利要求1所述的一种基于卷积神经网络的图像分类改进算法,其特征在于:步骤四中,采用三种不同尺度对特征图进行映射,分别采用三种不同的卷积操作进行卷积,使得不论输入图像大小如何,最终都能得到固定尺寸的特征图。5.根据权利要求1所述的一种基于卷积神经网络的图像分类改进算法,其特征在于:步骤五中,采用LDA对特征矩阵进行降维,全局散度矩阵St定义为:其中m为总样本数,xi为第i个样本向量,μ为所有样本的均值向量,T为矩阵论中求转置矩阵的数学符号。类内离散度矩阵Sω定义为:其中N为样本总类别数,Xi为第i类样本矩阵,x为第i类每一个样本的向量,μi为第i类所有样本的均值向量。类间离散度矩阵Sb定义为:Sb=St-Sω因此优化目标定义为:2CN110321967A权利要求书2/2页其中W∈Rd×(N-1),为N-1个特征向量组成的矩阵,通过优化目标公式,计算得到一组最优鉴别矢量构成的投影矩阵,该矩阵对N维特征空间进行投影,输出N-1维的低维特征空间。6.根据权利要求1所述的一种基于卷积神经网络的图像分类改进算法,其特征在于:本网络采用重叠的最大池化,即相邻池化窗口之间会有重叠区域,可以提升特征的丰富性,避免过拟合现象。7.根据权利要求1所述的一种基于卷积神经网络的图像分类改进算法,其特征在于:神经网络中中的数据送入到激活函数中计算,所使用的激活函数为修正线性单元LeakyReLU。3CN110321967A说明书1/4页基于卷积神经网络的图像分类改进算法技术领域[0001]本发明属于深度学习、图像处理领域,涉及到图像分类识别任务在改进后的深度神经网络技术下的应用。背景技术[0002]由于卷积神经网络的输入层可以直接处理多维数据,所以卷积神经网络在计算机视觉领域有广泛的应用。并且数字化不断驱动社会的发展,数据量大小也不容往日,各种海量数据不断出现,对于神经网络来说是个很大的挑战。为