预览加载中,请您耐心等待几秒...
1/8
2/8
3/8
4/8
5/8
6/8
7/8
8/8

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于数据增强的卷积神经网络图像识别研究高友文;周本君;胡晓飞【摘要】针对深度学习网络在处理图像分类的过程中数据集样本数较少和样本相似度较高的问题,在卷积神经网络模型AlexNet的基础上,提出了对数据集采用数据集扩增、背景分割和主成分分析等数据预处理方法.卷积神经网络模型的基本结构为5个卷积层,2个全连接层和dropout层.实验环境是ubuntu16.04系统,Caffe深度学习框架.实验首先对原始的公开数据集Leaves和苹果表面病变数据集进行分类识别测试,分别得到84%和78%的准确率.然后对数据增强后的数据集再进行测试,公开数据集leaves的准确率为86%,准确率提高了2%,苹果表面病变数据集的准确率为83%,准确率提高了5%.测试结果表明,通过数据增强处理后,公开数据集Leaves和苹果表面病变数据集在该网络上的识别准确率都有了一定的提升.【期刊名称】《计算机技术与发展》【年(卷),期】2018(028)008【总页数】4页(P62-65)【关键词】深度卷积神经网络;数据增强;识别精度;图像识别【作者】高友文;周本君;胡晓飞【作者单位】南京邮电大学通信与信息工程学院,江苏南京210003;南京邮电大学通信与信息工程学院,江苏南京210003;南京邮电大学地理与生物信息学院,江苏南京210003【正文语种】中文【中图分类】TP317.40引言随着科学的发展和技术的进步,图像技术已经得到了广泛的应用,例如在语音识别、图像识别、垃圾短信等方面,从开始的最简单的理论知识发展成为日常生活中随处可见的现象。而其中图像识别技术的应用尤为普遍。手机、电脑等的指纹解锁,公司签到所使用的打卡机,还有最新的人脸识别的签到系统,这些都是图像识别技术的官方应用。在德国汉诺威CeBTT展会的开幕式上,马云在现场发布并演示了一种最新的支付认证技术:人脸识别支付技术。这就意味着,当以后使用支付宝进行交易时,连手机都不需要携带了,只需要刷脸便可以轻松完成支付。图像识别技术发展至今,己经从最简单的数字识别发展到了物体的识别、人脸的识别,并且还在继续发展。从深度学习[1-2]发展而来的卷积神经网络(CNN)由纽约大学的YannLeCun于1998年提出[3]。早期的CNN模型较为简单[3],应用场景也非常单一,随着研究的不断深入,应用领域也在不断扩展。例如,卷积神经网络与深信度网络[4]结合产生的卷积深信度网络[5]成功应用于人脸的特征提取。AlexNet网络在大数据分析中取得了非常好的效果。在目标检测领域,R-CNN也取得了成功[6]。近年来。图像识别技术得到了进一步的提升[7-8]。在中国,卷积神经网络也成功应用于商品分类[9-11]和计算机视觉[12]等领域。CNN本质上是一个多层感知机,具有3个最优秀的特点:稀疏交互、权值共享、等变表示。通过减少权值的数量使得网络更加容易优化,另一方面也降低了过拟合的概率。CNN也属于神经网络,它的权值共享网络结构和生物神经网络很类似,采用这种做法,一方面不仅降低了网络模型的复杂度,而且还降低了权值的数量。多维图像传输时,这些优点更加突出。将原始图像作为网络的输入,就可以有效地避免传统识别算法中那些相对来说较为复杂的特征提取和数据重建的过程。处理二维图像也具有优势,如自行抽取包括颜色、纹理、形状的图像特征以及图像的拓扑结构。CNN在处理图像上拥有如此强大的能力,因此其在图像识别技术中的应用可能会得到一个好的表现。文中研究了卷积神经网络中的数据增强手段,并将其应用在公开数据集leaves和苹果表面病变数据集上,观察数据增强前后的准确率的变化情况。1卷积神经网络1.1卷积神经网络结构卷积神经网络是由人工神经网络和深度学习算法结合形成的,在图像处理方面效果显著。卷积神经网络包括输入层、隐层和输出层,输入层是未经处理的原始图像或进行一般预处理后的图像,输出层是对图像通过卷积神经网络进行特征提取后产生的结果,隐层是一种多层非线性结构的神经元层,包含三级:线性激活响应、探测级、池化函数。卷积神经网络是在隐层中实现对图像的特征提取以及分类的,所以通过实现对卷积层和单层感知器的优化就可以提高特征提取的精度和优化分类的效果。卷积神经网络的结构如图1所示。图1卷积神经网络结构为简化分析,图1中的隐层只画了2个卷积层(C1、C3),2个子采样层(S2、S4)。输入数据Input为原始图像,输出结果分为A~G七类。C层和S层作为提取特征的基本单元。多次特征提取后,光栅化得到的最终的特征图,得到一个一维矩阵形式的全连接层。输出结果通过全链接的方式得到。1.2CNN中的数据增强卷积神经网络需要优化[13]提高深度学习模型泛化能力的最好办法是使用更多的数据进行训练。当然,在实践中,拥有的数据量是有限的。解决这一问题的一种方法是创建假数据并添