预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115100459A(43)申请公布日2022.09.23(21)申请号202210660061.5(22)申请日2022.06.13(71)申请人天津大学地址300072天津市南开区卫津路92号(72)发明人周圆王海洋霍树伟(74)专利代理机构天津市北洋有限责任专利代理事务所12201专利代理师琪琛(51)Int.Cl.G06V10/764(2022.01)G06V10/774(2022.01)G06V10/40(2022.01)G06V10/82(2022.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书2页说明书4页附图3页(54)发明名称基于全注意力网络结构搜索的图像分类算法(57)摘要本发明公开了一种基于全注意力网络结构搜索的图像分类算法,首先设计一个阶段性搜索空间,网络的每个阶段选择不同的自注意力操作;然后使用自监督搜索方法进行搜索,更新网络内部权重参数和结构参数,当自监督搜索阶段完成时,保留结构参数,并使用它们作为监督搜索阶段的初始值;最后使用监督搜索方法进行搜索,更新网络内部权重参数和结构参数,根据结构参数得到最优的全注意力网络。本发明提出的搜索方法能够搜索出高性能的全注意力网络结构,同时保证所需的搜索效率。在图像分类任务上的实验结果表明,搜索出来的全注意力网络模型优于最先进的架构,同时大大减少了参数量。CN115100459ACN115100459A权利要求书1/2页1.一种基于全注意力网络结构搜索的图像分类算法,其特征在于,包括以下步骤:设计一个阶段性搜索空间,在该空间中,网络的每个阶段选择不同的自注意力操作;使用自监督搜索方法进行搜索,将图像输入到阶段性搜索空间的网络模型中,更新网络内部权重参数和结构参数,当自监督搜索阶段完成时,保留结构参数,并使用它们作为监督搜索阶段的初始值;使用监督搜索方法进行搜索,将图像输入到阶段性搜索空间的网络模型中,更新网络内部权重参数和结构参数,根据结构参数得到最优的全注意力网络。2.根据权利要求1所述基于全注意力网络结构搜索的图像分类算法,其特征在于,所述阶段性搜索空间的网络结构中,第一层是一个固定的局部自注意力操作,最后两层是平均池化层和分类层,其余中间部分由五个阶段构成,在第二个阶段和第四个阶段中存在一个固定的池化操作,将特征图的空间尺寸减半,通道数加倍;每个阶段有三个可搜索层,对于每个可搜索层,需要从很多个候选操作中选择出性能最优的操作;候选操作由7个自注意力操作组成,包括一个非局部自注意力操作和6个具有不同超参数的局部自注意力操作,局部自注意力操作的超参数包括空间范围和头部数量,其中空间范围选择3、5和7,头部数量选择4和8;综上所述,阶段性搜索空间包含15个可搜索层,每层从7个候选操作中进行选择,搜索空间包含了715个可能的结构。3.根据权利要求1所述基于全注意力网络结构搜索的图像分类算法,其特征在于,在自监督搜索阶段,设计一种基于上下文自回归任务的自监督搜索算法;上下文自回归任务指的是,将输入图像的多个区域随机掩盖,训练网络预测缺失部分的内容信息。采用一种编码器‑解码器结构去提取输入图像的特征,并对缺失的图像内容进行重建。然后,利用这个任务来搜索全注意力网络。使用全注意力网络作为特征编码器对输入图像进行特征提取;该网络包含两类可学习的参数:自注意力操作的权重参数w和每个候选操作对应的结构参数a;将图像数据集划分为两个独立的集合,分别用DatasetA和DatasetB表示;使用DatasetA数据集优化权重参数,使用DatasetB优化结构参数;使用L1损失作为损失函数,其定义如下:其中M为像素个数,pi为输入像素,yi为真实值;然后,采用可微分结构搜索方法交替优化权重参数w和结构参数a;以迭代的方式,在DatasetA数据集上通过梯度下降来优化权重参数,然后在DatasetB数据集上通过梯度下降来优化结构参数;当自监督搜索阶段完成时,存储结构参数,并使用它们作为监督搜索阶段的初始值。4.根据权利要求1所述基于全注意力网络结构搜索的图像分类算法,其特征在于,在监督搜索阶段,使用可微分结构搜索方法在图像分类数据集上进行搜索;使用自监督搜索阶段获得的结构参数作为初始值,采用梯度下降法交替优化结构参数α和权重参数w;使用交叉熵损失作为损失函数,其定义为:其中K为类别数,pk为属于第k类的预测概率,yk为类别标签;当监督搜索过程结束后,将2CN115100459A权利要求书2/2页结构参数排序,结构参数最大值对应的操作被选择出来,得到最终的体系结构。3CN115100459A说明书1/4页基于全注意力网络结构搜索的图像分类算法技术领域[0001]本发明涉及计算机视觉中的图