预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共22页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113635310A(43)申请公布日2021.11.12(21)申请号202111206993.4(22)申请日2021.10.18(71)申请人中国科学院自动化研究所地址100190北京市海淀区中关村东路95号(72)发明人邢登鹏杨依明李佳乐徐波(74)专利代理机构北京华夏泰和知识产权代理有限公司11662代理人李永叶(51)Int.Cl.B25J9/16(2006.01)权利要求书3页说明书15页附图3页(54)发明名称模型迁移方法、装置(57)摘要本公开涉及一种模型迁移方法、装置,上述方法包括:获取目标模型、验证数据集和参数微调数据集;对所述目标模型进行知识蒸馏处理,得到迁移模型,并在对所述目标模型进行所述知识蒸馏处理的过程中,根据所述验证数据集和所述知识蒸馏处理对应的误差函数,对所述迁移模型进行优化处理;使用所述参数微调数据集对所述迁移模型进行自监督训练,以对所述迁移模型的参数进行微调。采用上述技术手段,解决现有技术中,缺少机器人模型迁移的方法的问题。CN113635310ACN113635310A权利要求书1/3页1.一种模型迁移方法,其特征在于,包括:获取目标模型、验证数据集和参数微调数据集;对所述目标模型进行知识蒸馏处理,得到迁移模型,并在对所述目标模型进行所述知识蒸馏处理的过程中,根据所述验证数据集和所述知识蒸馏处理对应的误差函数,对所述迁移模型进行优化处理;使用所述参数微调数据集对所述迁移模型进行自监督训练,以对所述迁移模型的参数进行微调。2.根据权利要求1所述的方法,其特征在于,所述在对所述目标模型进行所述知识蒸馏处理的过程中,根据所述验证数据集和所述知识蒸馏处理对应的误差函数,对所述迁移模型进行优化处理,包括:根据第一验证数据集以及第一误差函数,对所述迁移模型进行优化处理,其中,所述验证数据集包括所述第一验证数据集,所述误差函数包括所述第一误差函数,所述第一误差函数用于表示所述目标模型的多头注意力层的输出和所述迁移模型的多头注意力层的输出之间的误差;和/或根据第二验证数据集以及第二误差函数,对所述迁移模型进行优化处理,其中,所述验证数据集包括所述第二验证数据集,所述误差函数包括所述第二误差函数,所述第二误差函数用于表示所述目标模型的全连接层的输出和所述迁移模型的全连接层的输出之间的误差;和/或根据第三验证数据集以及第三误差函数,对所述迁移模型进行优化处理,其中,所述验证数据集包括所述第三验证数据集,所述误差函数包括所述第三误差函数,所述第三误差函数用于表示所述目标模型的输出层的输出和所述第三验证数据集的标签之间的误差。3.根据权利要求2所述的方法,其特征在于,所述第一误差函数:;Sq为所述迁移模型的多头注意力层的头数,j为所述多头注意力层的序号,Aj为所述迁T移模型第j层的多头注意力层的输出,Aj为所述目标模型第j层的多头注意力层的输出,MSE()为均方误差函数。4.根据权利要求2所述的方法,其特征在于,所述第二误差函数:;STH为所述迁移模型的全连接层的输出,Wh为转化矩阵,H为所述目标模型的全连接层的输出,MSE()为均方误差函数。5.根据权利要求2所述的方法,其特征在于,所述第三误差函数:2CN113635310A权利要求书2/3页;为所述迁移模型的输出层的输出与所述第三验证数据集的标签之间的误差,MSE()为均方误差函数,B为所述迁移模型的输出层的输出,为所述第三验证数据集的标签。6.根据权利要求1所述的方法,其特征在于,所述在对所述目标模型进行所述知识蒸馏处理的过程中,根据所述验证数据集和所述知识蒸馏处理对应的误差函数,对所述迁移模型进行优化处理,包括:确定每次对所述迁移模型进行所述优化处理的第一批处理条数,其中,所述第一批处理条数用于指示每次优化所述迁移模型时,从所述验证数据集中选择的机器人的轨迹的条数;循环执行如下步骤对所述迁移模型进行所述优化处理:步骤一,从所述验证数据集中确定出所述第一批处理条数条所述机器人的轨迹;步骤二,根据确定出的每条轨迹生成第一矩阵,得到多个所述第一矩阵;步骤三,分别将多个所述第一矩阵依次输入所述迁移模型,得到多个第二矩阵;步骤四,通过所述误差函数计算每个所述第一矩阵与每个所述第一矩阵所对应的所述第二矩阵的误差值;步骤五,根据所述误差值对所述迁移模型进行所述优化处理;步骤六,在当前批次的所述优化处理中,以所述迁移模型最小为原则,在最后一个输入所述迁移模型的所述第一矩阵和最后一个输入所述迁移模型的所述第一矩阵所对应的所述第二矩阵的误差值小于第一预设阈值时,结束循环。7.根据权利要求6所述的方法,其特征在于,所述根据确定出的每条轨迹生成第一矩阵,得到多个所述第一矩阵,包括:确定所述轨迹对应的