一种基于知识蒸馏的多跨域少样本分类方法-豆柴文库

一种基于知识蒸馏的多跨域少样本分类方法.pdf

2023-07-25

10金币

785KB

14页

是你****盟主

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共14页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113610173A(43)申请公布日2021.11.05(21)申请号202110931565.1(22)申请日2021.08.13(71)申请人天津大学地址300072天津市南开区卫津路92号(72)发明人冀中倪婧玮刘西瑶(74)专利代理机构天津市北洋有限责任专利代理事务所12201代理人杜文茹(51)Int.Cl.G06K9/62(2006.01)G06N3/04(2006.01)G06N3/08(2006.01)权利要求书4页说明书8页附图1页(54)发明名称一种基于知识蒸馏的多跨域少样本分类方法(57)摘要一种基于知识蒸馏的多跨域少样本分类方法，利用知识蒸馏中师生网络的框架进行有效知识的迁移，从而使模型具有更好的泛化能力。本发明将元学习的训练策略引入知识蒸馏中，通过面向任务的知识蒸馏和多个教师网络之间的协作，不仅向学生网络提供了丰富且有效的知识，而且保证了学生网络对少样本任务的快速适应能力。通过引入多层次知识蒸馏，分别提取教师网络的输出预测和样本关系作为监督信息，从不同角度指导学生网络的训练，使得知识蒸馏的效率更高。由此，本发明能够将有效的知识更好地从多个源域迁移到目标域上，提高学生网络在目标少样本任务上的分类准确率。CN113610173ACN113610173A权利要求书1/4页1.一种基于知识蒸馏的多跨域少样本分类方法，其特征在于，包括如下步骤：1)预训练阶段，分别利用N个不同源域的训练集{Z1,Z2,…,ZN}来训练N个不同的教师网络，每个教师网络包含一个教师特征编码器E和教师分类器C，初始化N个教师网络参数，利用交叉熵损失函数对每一个教师网络进行预训练，最终得到N个训练好的教师网络；2)构建学生网络，学生网络是一种基于度量的少样本模型，包含一个学生特征编码器Es和一个度量函数d，初始化学生特征编码器Es的参数；3)元训练阶段，从N个不同源域的训练集中随机选取一个训练集作为当前的元训练集Dtrain，根据元学习的思想，从当前的元训练集Dtrain中随机采样一定量的少样本任务，每个任务都包含一个支持集S和一个查询集Q，支持集中含有W个类别的数据，每个类别有K个样本；4)依次将不同的少样本任务同时送到N个教师网络和学生网络中；5)依次将支持集S中第k个样本图像xk输入到N个教师特征编码器和学生特征编码器中，分别得到相对应的视觉特征其中xk为支持集S中第k个样本图像，En为第n个教师特征编码器，Es为学生特征编码器，为第n个教师特征编码器En对xk编码后输出的视觉特征，为学生特征编码器Es对xk编码后输出的视觉特征；6)分别对支持集中属于同一类别的样本视觉特征取平均，得到每个类别的原型表示为：其中K为第w个类别的样本总数，为经过第n个教师特征编码器编码后的第w个类别的原型表示，为经过学生特征编码器编码后的第w个类别的原型表示；7)依次将查询集的样本图像xQ输入到N个教师特征编码器和学生特征编码器中，分别得到相对应的视觉特征和其中xQ为查询集Q中的样本图像，En为第n个教师特征编码器，Es为学生特征编码器，为第n个教师特征编码器En对xQ编码后输出的视觉特征，为学生特征编码器Es对xQ编码后输出的视觉特征；8)根据经过学生特征编码器编码后的原型表示和查询集样本图像的视觉特征，按照如下公式计算查询集样本图像xQ属于支持集中各个类别的概率：2CN113610173A权利要求书2/4页s其中p(y＝w|xQ)为学生网络输出的查询集样本图像xQ属于第w个类别的预测概率，W为支持集中类别的总数，函数d为欧氏距离的度量函数，exp为自然常数e为底的指数函数；9)根据学生网络输出的查询集样本图像xQ的类别预测概率计算分类损失，设定学生网络的分类目标函数Lcls如下：s其中yQ为查询集中样本图像xQ的真实标签，p(y＝w|xQ)为学生网络输出的查询集样本图像xQ属于第w个类别的预测概率，W为支持集中类别的总数；10)根据经过N个教师特征编码器和学生特征编码器编码后的原型表示和查询集样本图像的视觉特征，利用温度系数τ计算软化后的类别预测概率分布，从而在N个教师网络和学生网络之间进行基于软标签的知识蒸馏，得到学生网络的基于软标签的目标函数LKL；11)根据经过N个教师特征编码器和学生特征编码器编码后的原型表示和查询集样本图像的视觉特征，利用成对的特征计算相似度矩阵，从而在N个教师网络和学生网络之间进行基于相似度的知识蒸馏，得到学生网络的基于相似度的目标函数Lsim；12)根据如下学生网络的总目标函数公式，使用SGD算法训练学生特征编码器：L＝Lcls+LKL+Lsim(21)其中，L为学生网络的总目标函数，LKL为学生网络的基于软标签的目标函数，Lsim为学生

相关资料

一种基于知识蒸馏的多跨域少样本分类方法.pdf

一种基于知识蒸馏的多跨域少样本分类方法，利用知识蒸馏中师生网络的框架进行有效知识的迁移，从而使模型具有更好的泛化能力。本发明将元学习的训练策略引入知识蒸馏中，通过面向任务的知识蒸馏和多个教师网络之间的协作，不仅向学生网络提供了丰富且有效的知识，而且保证了学生网络对少样本任务的快速适应能力。通过引入多层次知识蒸馏，分别提取教师网络的输出预测和样本关系作为监督信息，从不同角度指导学生网络的训练，使得知识蒸馏的效率更高。由此，本发明能够将有效的知识更好地从多个源域迁移到目标域上，提高学生网络在目标少样本任务上的

2023-07-25

785KB

一种基于全局-局部知识蒸馏的跨域小样本图像分类方法.pdf

本发明提供了一种基于全局‑局部知识蒸馏的跨域小样本图像分类方法。构建了由全局分支和局部分支构成的分类模型，其中，全局分支以原始图像为输入，用于提取图像的全局特征，局部分支以原始图像的局部块为输入，用于提取该图像的局部特征；在两分支之间，通过构建全局‑局部知识蒸馏损失促进全局特征关注到图像的局部区域，使得全局特征捕获丰富的语义信息，进而提升全局特征在跨域小样本任务上的泛化性能。

2023-06-02

586KB

一种基于ALBERT和LDA的跨域情感分类方法.pdf

本发明公开了一种基于ALBERT和LDA的跨域情感分类方法，首先进行模型训练与数据的预处理，使用训练数据集对ALBERT模型进行训练，得到用于对目标领域数据检测的ALBERT模型，同时，使用目标领域的数据集进行主题模型训练，得到用于文本主题信息提取的LDA模型；随后针对输入的文本信息进行处理，使用ALBERT对该数据进行处理，得到处理后的向量，同时将该文本输入至LDA模型进行主题信息检测，得到文本主题信息，将处理后的向量与文本主题信息进行结合，输入到一个自适应分类器之中进行情感分类，最终输出情感分类标签。

2023-07-24

469KB

基于梯度蒸馏的少样本学习的鸟类分类系统、方法与装置.pdf

本发明公开了基于梯度蒸馏的少样本学习的鸟类分类系统、方法与装置，通过构建鸟类图像分类数据集；在训练阶段，从鸟类图像分类数据集抽取支撑集s和预测集q，经教师网络后，分别输出的特征向量进行匹配，得到预测集q的类别预测结果，并利用所述预测结果与预测集q的类别真值构建教师网络交叉熵损失函数，训练教师网络；获取鸟类图像经过教师网络、学生网络各个网络层的特征，并利用各层特征的和，作为损失值反向传播，得到输入的鸟类图像基于损失值的梯度信息，构建梯度损失函数，使教师网络和学生网络输入的鸟类图像的梯度信息相匹配；梯度损失函

2023-06-04

1.5MB

一种跨域图像分类方法.pdf

本发明公开一种跨域图像分类方法，该方法用视觉特征提取器提取待分类目标域图像的初始视觉特征，并利用初始视觉特征构建领域对齐损失函数、类别对齐损失函数和结构对齐损失函数，再构建分类器，最后利用视觉特征提取器和分类器获得待分类的目标域图像的分类结果。该方案利用领域对齐损失函数、类别对齐损失函数和结构对齐损失函数来减小待分类目标域图像各个领域之间的差异，提高对跨域图像的分类精度。

2023-07-25

853KB