预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115953621A(43)申请公布日2023.04.11(21)申请号202211571102.X(22)申请日2022.12.08(71)申请人华中师范大学地址430079湖北省武汉市洪山区珞瑜路152号(72)发明人孙昊姚华雄陈仁义谢伟(74)专利代理机构武汉科皓知识产权代理事务所(特殊普通合伙)42222专利代理师王琪(51)Int.Cl.G06V10/764(2022.01)G06V10/774(2022.01)G06V10/82(2022.01)G06N3/08(2023.01)G06N3/0464(2023.01)权利要求书3页说明书9页附图1页(54)发明名称一种基于不可靠伪标签学习的半监督高光谱图像分类方法(57)摘要本发明公开了一种基于不可靠伪标签学习的半监督高光谱图像分类方法,包括:(1)搭建两个具有相同结构的教师和学生神经网络模型用于提取样本特征;(2)使用少量标记样本预先训练教师网络模型;(3)根据类别概率将无标记样本划分成可靠和不可靠样本;(4)将可靠的预测值作为正确的伪标签,同少量标记样本计算监督损失;(5)通过采样的策略构造锚点像素、正样本和负样本,使用对比学习重新利用不可靠预测值的样本特征;(6)计算目标函数,优化神经网络模型参数;(7)预测高光谱图像分类性能。本发明采取对比学习方式将不可靠伪标签作为对应类别的负样本,为模型补充大量的互补信息,提高了模型的分类性能。CN115953621ACN115953621A权利要求书1/3页1.一种基于不可靠伪标签学习的半监督高光谱图像分类方法,其特征在于,包括如下步骤:(1)基于知识蒸馏模型搭建神经网络,构建两个具有相同结构的学生网络和教师网络结构用于样本的特征提取;(2)采取监督学习方式在标记样本集上预先训练教师网络模型,得到初始的分类器;(3)无标记样本经过学生网络后得到样本的类别概率,通过无标记样本类别概率计算得到的熵,将无标记样本划分成可靠样本和不可靠样本;(4)将可靠的无标记样本作为正确的伪标签加入到标记样本中,计算标记样本和无标记样本的监督损失,优化教师神经网络;(5)对于不可靠的无标记样本部分,使用对比学习方式充分利用不可靠像素点的样本特征,通过采样的方式在对应集合中构造锚点像素、正样本和负样本,用于计算对比损失,优化教师网络;(6)构建模型的目标函数,通过反向传播策略更新教师网络参数,使用教师网络模型参数更新学生网络参数;(7)加载训练好的网络模型,在测试集上预测像素点对应的类别信息,通过与真实标签进行对比来计算分类精度。2.如权利要求1所述的一种基于不可靠伪标签学习的半监督高光谱图像分类方法,其特征在于:所述学生网络和教师网络均为基于视觉transformer模型,包括线性转换器,编码器和分类器;教师网络在前N次迭代过程中,首先,带有标签的高光谱图像块Xi经过线性转换器后结合可训练的类别嵌入作为编码器h的输入信息;其次,通过多层的编码器获取样本的输出特征,借助分类器f得到样本的类别概率;最后,利用交叉熵函数计算预测值和真实标签之间的误差,来优化教师网络参数。3.如权利要求1所述的一种基于不可靠伪标签学习的半监督高光谱图像分类方法,其特征在于:步骤(3)的具体实现方式如下;(3a)获取无标记样本类别概率:无标记样本经过学生网络编码器和分类器后得到样C本的类别概率pj∈R;(3b)计算无标记样本的熵:通过无标记样本的类别概率计算得到的熵,来反应样本预测值的可靠性,使用步骤(3a)生成的类别概率计算无标记样本的熵H(pj);其中,C表示类别数目;(3c)根据动态阈值将无标记样本划分可靠和不可靠样本:将熵低于阈值γt的无标记样本作为可靠标记样本,反之,作为不可靠样本;其中,percentile()表示分位数,flatten()表示线性展平操作,是初始的比例,2CN115953621A权利要求书2/3页是第t次迭代的比例,epochs表示模型总的迭代次数,t是当前训练次数。4.如权利要求3所述的一种基于不可靠伪标签学习的半监督高光谱图像分类方法,其特征在于:步骤(4)的具体实现方式如下;(4a)标记样本监督损失:标记样本经过教师网络特征提取后得到样本的预测值,通过交叉熵函数计算标记样本预测值和真实标签的监督损失Ls:其中,lce是交叉熵损失函数,θ表示教师网络总的训练参数,|Dl|是标记样本数目,h和f分别表示编码器和分类器;(4b)无标记样本的监督损失:首先,将步骤(3)获得样本部分可靠的预测值,选取像素j类别概率的熵低于阈值γt的预测值作为无标记样本正确的伪标签扩大模型标记训练样本的数目:其中,γt表示判断无标记样本为可靠伪标签的阈值;然后,对应无标记样本经过教师神经网络的输出