预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN114881155A(43)申请公布日2022.08.09(21)申请号202210524205.4(22)申请日2022.05.13(71)申请人重庆邮电大学地址400065重庆市南岸区黄桷垭崇文路2号(72)发明人郑太雄方芳杨新琴(74)专利代理机构北京同恒源知识产权代理有限公司11275专利代理师廖曦(51)Int.Cl.G06K9/62(2022.01)G06N3/04(2006.01)G06N3/08(2006.01)G06V10/32(2022.01)权利要求书2页说明书5页附图4页(54)发明名称基于深度迁移学习的水果图像分类方法(57)摘要本发明涉及一种基于深度迁移学习的水果图像分类方法,属于农业信息化领域。该算法通过冻结低层网络参数,使低层网络结构作为特征提取器,并修改高层网络参数和结构,提出新的迁移模型TL‑VGG16、TL‑InceptionV3和TL‑ResNet50。通过对三种迁移模型分别输入图像进行小样本训练,实现对不同水果图像的准确分类。最后对三种迁移模型分别使用加权平均法和相对多数投票法进行融合,输出新的预测概率。本发明解决了传统深度网络在识别图像时层数较深、训练耗时较长、模型收敛较慢和小数据集情况下过拟合情况较严重等问题,实现了深度网络的参数轻量级,降低了训练难度,并增加了深度网络在智能农业应用中的普遍性。CN114881155ACN114881155A权利要求书1/2页1.基于深度迁移学习的水果图像分类方法,其特征在于:该方法具体包括以下步骤:S1:下载VGG16、InceptionV3和ResNet50模型在ImageNet数据集上预训练好的的初始权重;S2:按原模型搭建VGG16网络的前13层卷积层,引用初始权重并冻结卷积层的所有参数,使卷积层参数不参与训练,然后对顶端的三层全连接层进行修改,即将第一层全连接层参数量减半,并去除第二层全连接层,将第三层全连接层的输出维度由1000改为目标分类数目,提出新的迁移模型TL‑VGG16网络;S3:按原模型搭建InceptionV3模型的卷积层,引用初始权重并冻结卷积层的所有参数,使卷积层不参与训练,并剔除Inception_4a后接的辅助分类器1,即aux_1和Inception_4d后接的辅助分类器2,即aux_2,然后将最后的输出层即主分类器的维度缩减到实际分类个数,提出新的迁移模型TL‑InceptionV3;S4:按原模型搭建ResNet50模型的卷积层,引用初始权重并冻结卷积层的所有参数,使卷积层不参与训练,然后对平均池化下采样层和全连接层进行修改,即将卷积层后接的7×7全局平均池化层用两个stride为2的3×3卷积结构替代,添加一层全连接层,将输出层维数缩减到数据集分类个数,提出新的迁移模型TL‑ResNet50;S5:将自然条件下采集的图像按照ImageNet公开数据集的图像处理方式进行图像处理,然后将处理后的图像分别输入步骤S2、S3和S4中的改进后的迁移模型进行训练;S6:将步骤S5中训练好的模型通过加权平均法进行模型融合,将各个模型输出的类别概率进行相加求平均;S7:基于步骤S6中的加权平均法模型融合框架,输入预测图片进行三个迁移模型的预测,输出预测概率,并将三个预测概率进行加权平均,输出融合后预测概率;S8:将步骤S5中训练好的模型通过相对多数投票法进行模型融合,遵循少数服从多数原则,取票数最多的预测类别为输出类别;S9:基于步骤S8中的相对多数投票法模型融合框架,输入预测图片进行三个迁移模型的预测,输出预测概率,并对三个预测概率选择票数最多的作为预测结果,输出融合后的预测概率。2.根据权利要求1所述的基于深度迁移学习的水果图像分类方法,其特征在于:所述S1中,利用经典网络作为跳板,将若干在ImageNet上训练好的权重迁移到针对不同水果的分类任务中,针对不同环境下的不同种类的水果的图像进行统一训练,识别水果的种类、色泽、形状和新鲜度。3.根据权利要求2所述的基于深度迁移学习的水果图像分类方法,其特征在于:所述S5中,需对输入图像进行批归一化处理BN,加速网络的收敛,使featuremap的数据满足均值为0,方差为1的分布规律,其计算公式如下:其中,E[x(k)]指的是训练一批数据时,各神经元输入值的平均值;指的是训练一批数据时各神经元输入值的标准差;输入x为RGB三通道的彩色图像,channels为3,x=(x(1),x(2),x(3)),x(1)、x(2)、x(3)分别代表R、G、B通道所对应的特征矩阵。2CN114881155A权利要求书2/2页4.根据权利要求3所述的基于深度迁移学习的水果图像分类方法,其特征在于:所述S5中,对输入图像进行预处理,在