预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于深度学习的植物图像识别方法研究袁银++王东斌++刘永金摘要传统植物图像识别研究主要集中在植物叶片图像。研究将深度神经网络学习运用于植物识别领域,突破局部叶片图像的限制,对常规植物图片进行识别。该方法运用googleNet的深度卷积神经网络结构,通过图像旋转、镜像、随机裁剪等数据预处理方法扩充训练集,再利用SGD(随机梯度下降法)进行模型算法优化,生成对50种常规植物图像的识别模型。结果表明,该模型在测试集上能够达到平均90%的准确率。关键词植物图像识别;深度学习;神经网络TP391.41A1007-5739(2017)23-0278-03AbstractTraditionalplantimagerecognitionresearchismainlyfocusedonplantleafimages.Thedeepneuralnetworkwasappliedtothefieldofplantrecognition,itbreaksthroughtherestrictionofthelocalleafimageandidentifiestheconventionalplantpictures.GoogleNetdeepconvolutionneuralnetworkstructurewasused,thetrainingsetwasextendbydatapreprocessingmethodssuchasimagerotation,mirrorimage,randomclippingandsoon,andthenSGD(stochasticgradientdescentmethod)wasusedtooptimizethemodelalgorithmtogenerate50kindsofcommonplantimagerecognitionmodel.Theresultsshowedthatthemodelcouldachieveanaverageaccuracyof90%onthetestdataset.Keywordsplantimagerecognition;depthlearning;neuralnetwork植物是地球分布最廣泛的生命形式,与人类生活环境的关系最为密切。目前,植物物种的识别主要依靠有经验的专家和相关行业从业人员的专业知识和实践经验,工作量大且效率低。随着计算机的计算能力大幅提升,尤其是移动终端性能的提升和普及,人们获取、保存和处理植物图像的能力大幅度提升。研究如何通过植物图像快速识别植物种类具有非常重要的意义,既可以促进植物分类学科的发展,又可以普及植物知识,激发人们热爱植物、保护环境生态的热情[1-3]。目前,业内对植物图像识别的研究主要集中在植物叶片图像的识别方法上。在国外,早在1993年,Guyer等[4]通过提取17种叶片形状特征对40类植物进行分类。在国内,杜吉祥等[5]研究了用Gabor小波对植物叶片图像进行多尺度纹理特征提取,再利用神经网络模型对特征向量进行分类识别的方法。张宁[6]提出了一种基于克隆选择算法和K近邻判别分析的叶片识别方法。李萍等[7]提出了一种基于改进稀疏表示的植物识别方法,利用最近邻准则实现稀疏表示,通过稀疏表示系数实现植物识别,而不需要进行特征提取。随着构建深层网络结构进行多层次特征学习的人工智能方法在大规模图片分类(ImageNet)竞赛上取得突破性进展,其在各个方面都受到了极大的关注,在图像识别与语音识别领域也取得了很大的成功[8-10]。本文将深度学习应用在植物图像识别领域,使植物识别突破只能依靠局部叶片图像的限制,实现对常规植物图片的识别。1深度学习的概念及原理神经网络的基本神经元的结构是wx+b的形式,如图1所示,其中x1,x2表示输入向量,w1,w2为权重,有几个输入则意味着有几个权重,即每个输入都被赋予一个权重,b为偏置bias,g(z)为激活函数,a为输出。最终得到的输出是g(z)=g(w1×x1+w2×x2+b),g是激活函数。深度学习(deeplearning)是深度神经网络学习方法的简称,传统的神经网络一般有一个隐藏层,神经元之间采取全连接的方式,而深度学习基于深层构建的结构,在神经网络的输入和输出中间有多层的神经元网络(图2)。卷积神经网络(convolutionalneuralnetwork)广泛应用在图像领域。图3为卷积神经网络中的一个卷积层,由卷积操作(convolution)、非线性响应操作(relu)以及池化操作(pooling)组成。CONV为卷积计算层,线性乘积求和。由图4可知,左边是图像输入,中间部分就是滤波器filter(带着一组固定权重的神经元,也称卷积核),不同的滤波器filter会得到不同的输出数据,比如颜色深浅、轮