预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113743484A(43)申请公布日2021.12.03(21)申请号202110961232.3(22)申请日2021.08.20(71)申请人宁夏大学地址750021宁夏回族自治区银川市贺兰山西路489号(72)发明人杨军刘孟鑫马利亚(74)专利代理机构广州市华学知识产权代理有限公司44245代理人冯炳辉(51)Int.Cl.G06K9/62(2006.01)G06K9/32(2006.01)G06N3/04(2006.01)权利要求书3页说明书6页附图2页(54)发明名称基于空间和通道注意力机制的图像分类方法与系统(57)摘要本发明公开了一种基于空间和通道注意力机制的图像分类方法与系统,包括:S1、获取样本数据集;S2、从样本数据集中抽取特定数量的图像,利用深度卷积生成对抗网络DCGAN生成假样本,得到扩充数据集;S3、对扩充数据集进行处理,包括降维、去噪及数据增强;S4、将扩充数据集按比例进行划分,得到训练集和测试集;S5、将训练集中的图像输入到已构建的图像分类网络模型中进行调参训练,从中提取图像的特征,最后保存训练好的图像分类网络模型;S6、将测试集中的图像加载到训练好的图像分类网络模型中进行判别,模型输出的结果即为分类结果。本发明可以实现目标类型图像的准确分类。CN113743484ACN113743484A权利要求书1/3页1.基于空间和通道注意力机制的图像分类方法,其特征在于,包括以下步骤:S1、获取待判别分类的目标类型的图像样本,并构建相应的样本数据集;S2、从获取的样本数据集中抽取特定数量的图像,利用深度卷积生成对抗网络DCGAN生成假样本,从而对获取的样本数据集进行扩充,得到扩充数据集;S3、对扩充数据集进行处理,包括降维、去噪及数据增强;S4、将步骤S3处理后的扩充数据集按比例进行划分,将大部分数据划分为训练集,小部分数据划分为测试集;S5、将训练集中的图像输入到已构建的图像分类网络模型中进行调参训练,从中提取图像的特征,最后保存训练好的图像分类网络模型;其中,所构建的图像分类网络模型由DenseNet、空间注意力机制、通道注意力机制SE‑Net和分类子模块组成,DenseNet为模型的主干网络,用于提取图像的全局特征及特征复用;空间注意力机制嵌入于DenseNet中,将图片的空间域信息做对应的空间变换,只关心感兴趣的位置,从而将关键信息提取出来;通道注意力机制SE‑Net通过建模各个特征通道的重要程度,针对特征的重要性抑制或增强不同的通道;分类子模块利用Softmax作为核心,将各类图像做到精准分类;该图像分类网络模型通过空间注意力机制获取感兴趣部位,利用通道注意力机制SE‑Net获取特征的权重,强调有用信息抑制无用信息,并将其输入到分类子模块;S6、将测试集中的图像加载到训练好的图像分类网络模型中进行判别,模型输出的结果即为分类结果。2.根据权利要求1所述的基于空间和通道注意力机制的图像分类方法,其特征在于,在步骤S2中,从获取的样本数据集中抽取特定数量的图像生成假样本,采用无监督学习的深度卷积生成对抗网络DCGAN,通过DCGAN的生成器G与判别器D相互博弈最终达到纳什均衡,使生成器G生成的样本能欺骗过判别器D,最终判别样本为真;其中,生成假样本的具体过程如下:S21、生成器G从给定噪声中产生合成数据,经过上采样与反卷积操作,最终将高层表征转换成分辨率小的像素图像,全过程没有使用全连接层和池化层,其中给定噪声服从均匀分布或者正态分布;S22、判别器D分辨生成器G的输出是否为真实数据;后者试图产生更接近真实的数据,相应地,前者试图更好地分辨真实数据与生成数据;由此,生成器G与判别器D在对抗中进步,在进步后继续对抗,由生成器G得到的数据也就越来越完美,逼近真实数据,从而能够生成想要得到的图像;其优化目标函数如下:式中,V(D,G)为生成器G和判别器D的向量表示;x表示真实图片;表示真实图片服从均匀分布或者正态分布;表示噪声服从均匀分布或者正态分布;D(x)表示判别器D判别真实图片是否为真实的概率;G(z)代表生成器G生成的图片;D(G(z))表示判别器D判断生成器G生成的图片是否为真的概率。3.根据权利要求1所述的基于空间和通道注意力机制的图像分类方法,其特征在于,在步骤S3中,采用主成分分析方法PCA对扩充数据集进行降维、去噪,从而减少数据冗余,其包2CN113743484A权利要求书2/3页括以下内容:a、将图像变成矩阵;b、对所有特征进行去均值操作;c、求协方差矩阵;d、求协方差的特征值和相对应的特征向量;e、将特征值排序;f、保留前N个最大的特征值对应的特征向量;g、将原始特征投影到得到的N个特征向量构建的新空间中