预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共21页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114219047A(43)申请公布日2022.03.22(21)申请号202210150906.6(22)申请日2022.02.18(71)申请人深圳大学地址518060广东省深圳市南山区粤海街道南海大道3688号(72)发明人陆玉武林德伟(74)专利代理机构深圳中一联合知识产权代理有限公司44414代理人杨志强(51)Int.Cl.G06K9/62(2022.01)G06N20/00(2019.01)权利要求书2页说明书16页附图2页(54)发明名称一种基于伪标签筛选的异构域自适应方法、装置及设备(57)摘要本申请提供了一种基于伪标签筛选的异构域自适应方法,该方法利用投影矩阵将文字样本和图像样本投影到公共子空间上生成投影样本,投影样本的边缘分布对齐,保留投影样本中标记投影样本的判别性知识,投影样本与文字样本和图像样本的信息损失尽可能少;基于标记投影样本,利用第c类的文字样本和第c类的图像样本确定第c类的投影样本的均值向量;基于第c类的投影样本的均值向量确定第c类投影样本的均值向量和每个未标记图像投影样本的特征相关系数;基于每个未标记图像投影样本的特征相关系数,在多个未标记投影样本中筛选出具有高特征相关系数的训练子集。本申请提供的方法实现了未标记图像投影样本中的伪标签的筛选,提高了模型的训练精度。CN114219047ACN114219047A权利要求书1/2页1.一种基于伪标签筛选的异构域自适应方法,其特征在于,所述方法包括:利用投影矩阵将文字样本和图像样本投影到公共子空间上,生成投影样本,所述公共子空间上的投影样本的边缘分布对齐,保留所述投影样本中标记投影样本的判别性知识,所述投影样本与所述文字样本和图像样本的损失小于第一阈值,所述投影样本包括:未标记投影样本和标记投影样本;基于所述标记投影样本,利用第c类的文字投影样本和第c类的图像投影样本确定第c类的投影样本的均值向量,c为整数;基于所述第c类的投影样本的均值向量,确定每个未标记投影图像样本与所述第c类的投影样本的均值向量的特征相关系数;基于所述特征相关系数,在多个未标记投影图像样本中筛选训练子集,所述训练子集用于机器学习中模型的训练。2.根据权利要求1所述的方法,其特征在于,所述基于所述标记投影样本,利用第c类的文字投影样本和第c类的图像投影样本确定第c类的投影样本的均值向量,包括:利用如下计算公式计算所述第c类的投影样本的均值向量:其中,P表示投影矩阵,表示第i个属于第c类的文字投影样本,表示第i个属于第c类的图像投影样本,l表示该投影样本是被标记的;表示属于第c类文字投影样本的总数,表示属于第c类图像投影样本的总数,ZC表示第c类投影样本的均值向量。3.根据权利要求1所述的方法,其特征在于,所述基于所述第c类的投影样本的均值向量,确定每个未标记图像投影样本与所述第c类的投影样本的均值向量的特征相关系数,包括:利用如下计算公式,计算每个未标记图像投影样本与第c类的投影样本的均值向量的特征相关系数:其中,表示第c类均值向量ZC和第j个未标记的图像投影样本的相关系数,u值表示该图像投影样本是未标记的,表示第c类均值向量ZC和第j个未标记的图像投影样本的协方差,表示均值向量ZC的均值,表示第j个未标记的图像投影样本的均值,表示该图像投影样本的伪标2CN114219047A权利要求书2/2页签属于伪标签的条件概率。4.根据权利要求3所述的方法,其特征在于,所述基于所述特征相关系数,在多个未标记图像投影样本中筛选训练子集,包括:基于所述特征相关系数,利用如下公式给所述第j个未标记图像投影样本分配伪标签:其中,表示第j个未标记图像投影样本的伪标签。5.根据权利要求4所述的方法,其特征在于,所述方法还包括:基于每个未标记图像样本的伪标签以及特征相关系数,根据每个类别中前N个特征相关系数的图像样本确定所述训练子集,所述训练子集用于下一次迭代学习。6.根据权利要求5所述的方法,其特征在于,所述方法还包括:利用如下计算公式确定目标函数:其中,P表示投影矩阵,K表示在再生希尔伯特空间中的投影矩阵,、、表示惩罚函数,M表示MMD矩阵,Ls表示同类样本的拉普拉斯矩阵,Ld表示不同类样本的拉普拉斯矩阵,I表示单位矩阵;根据所述目标函数确定所述投影矩阵。7.一种基于伪标签筛选的异构域自适应装置,其特征在于,所述装置包括用于执行如权利要求1至6任一项所述方法的单元。8.一种电子设备,其特征在于,所述电子设备包括处理器,所述处理器用于执行如权利要求1至6中任一项所述的方法。9.一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述的方法。10.一