模型迁移方法、装置-豆柴文库

模型迁移方法、装置.pdf

2023-07-25

10金币

602KB

22页

春岚****23

实名认证

内容提供者

1/10

2/10

3/10

4/10

5/10

6/10

7/10

8/10

9/10

10/10

亲，该文档总共22页，到这已经超出免费预览范围，如果喜欢就直接下载吧～

下载提示文本预览

如果您无法下载资料，请参考说明：

1、部分资料下载需要金币，请确保您的账户上有足够的金币

2、已购买过的文档，再次下载不重复扣费

3、资料包下载后请先用软件解压，在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113635310A(43)申请公布日2021.11.12(21)申请号202111206993.4(22)申请日2021.10.18(71)申请人中国科学院自动化研究所地址100190北京市海淀区中关村东路95号(72)发明人邢登鹏杨依明李佳乐徐波(74)专利代理机构北京华夏泰和知识产权代理有限公司11662代理人李永叶(51)Int.Cl.B25J9/16(2006.01)权利要求书3页说明书15页附图3页(54)发明名称模型迁移方法、装置(57)摘要本公开涉及一种模型迁移方法、装置，上述方法包括：获取目标模型、验证数据集和参数微调数据集；对所述目标模型进行知识蒸馏处理，得到迁移模型，并在对所述目标模型进行所述知识蒸馏处理的过程中，根据所述验证数据集和所述知识蒸馏处理对应的误差函数，对所述迁移模型进行优化处理；使用所述参数微调数据集对所述迁移模型进行自监督训练，以对所述迁移模型的参数进行微调。采用上述技术手段，解决现有技术中，缺少机器人模型迁移的方法的问题。CN113635310ACN113635310A权利要求书1/3页1.一种模型迁移方法，其特征在于，包括：获取目标模型、验证数据集和参数微调数据集；对所述目标模型进行知识蒸馏处理，得到迁移模型，并在对所述目标模型进行所述知识蒸馏处理的过程中，根据所述验证数据集和所述知识蒸馏处理对应的误差函数，对所述迁移模型进行优化处理；使用所述参数微调数据集对所述迁移模型进行自监督训练，以对所述迁移模型的参数进行微调。2.根据权利要求1所述的方法，其特征在于，所述在对所述目标模型进行所述知识蒸馏处理的过程中，根据所述验证数据集和所述知识蒸馏处理对应的误差函数，对所述迁移模型进行优化处理，包括：根据第一验证数据集以及第一误差函数，对所述迁移模型进行优化处理，其中，所述验证数据集包括所述第一验证数据集，所述误差函数包括所述第一误差函数，所述第一误差函数用于表示所述目标模型的多头注意力层的输出和所述迁移模型的多头注意力层的输出之间的误差；和/或根据第二验证数据集以及第二误差函数，对所述迁移模型进行优化处理，其中，所述验证数据集包括所述第二验证数据集，所述误差函数包括所述第二误差函数，所述第二误差函数用于表示所述目标模型的全连接层的输出和所述迁移模型的全连接层的输出之间的误差；和/或根据第三验证数据集以及第三误差函数，对所述迁移模型进行优化处理，其中，所述验证数据集包括所述第三验证数据集，所述误差函数包括所述第三误差函数，所述第三误差函数用于表示所述目标模型的输出层的输出和所述第三验证数据集的标签之间的误差。3.根据权利要求2所述的方法，其特征在于，所述第一误差函数：；Sq为所述迁移模型的多头注意力层的头数，j为所述多头注意力层的序号，Aj为所述迁T移模型第j层的多头注意力层的输出，Aj为所述目标模型第j层的多头注意力层的输出，MSE()为均方误差函数。4.根据权利要求2所述的方法，其特征在于，所述第二误差函数：；STH为所述迁移模型的全连接层的输出，Wh为转化矩阵，H为所述目标模型的全连接层的输出，MSE()为均方误差函数。5.根据权利要求2所述的方法，其特征在于，所述第三误差函数：2CN113635310A权利要求书2/3页；为所述迁移模型的输出层的输出与所述第三验证数据集的标签之间的误差，MSE()为均方误差函数，B为所述迁移模型的输出层的输出，为所述第三验证数据集的标签。6.根据权利要求1所述的方法，其特征在于，所述在对所述目标模型进行所述知识蒸馏处理的过程中，根据所述验证数据集和所述知识蒸馏处理对应的误差函数，对所述迁移模型进行优化处理，包括：确定每次对所述迁移模型进行所述优化处理的第一批处理条数，其中，所述第一批处理条数用于指示每次优化所述迁移模型时，从所述验证数据集中选择的机器人的轨迹的条数；循环执行如下步骤对所述迁移模型进行所述优化处理：步骤一，从所述验证数据集中确定出所述第一批处理条数条所述机器人的轨迹；步骤二，根据确定出的每条轨迹生成第一矩阵，得到多个所述第一矩阵；步骤三，分别将多个所述第一矩阵依次输入所述迁移模型，得到多个第二矩阵；步骤四，通过所述误差函数计算每个所述第一矩阵与每个所述第一矩阵所对应的所述第二矩阵的误差值；步骤五，根据所述误差值对所述迁移模型进行所述优化处理；步骤六，在当前批次的所述优化处理中，以所述迁移模型最小为原则，在最后一个输入所述迁移模型的所述第一矩阵和最后一个输入所述迁移模型的所述第一矩阵所对应的所述第二矩阵的误差值小于第一预设阈值时，结束循环。7.根据权利要求6所述的方法，其特征在于，所述根据确定出的每条轨迹生成第一矩阵，得到多个所述第一矩阵，包括：确定所述轨迹对应的

相关资料

模型迁移方法、装置.pdf

本公开涉及一种模型迁移方法、装置，上述方法包括：获取目标模型、验证数据集和参数微调数据集；对所述目标模型进行知识蒸馏处理，得到迁移模型，并在对所述目标模型进行所述知识蒸馏处理的过程中，根据所述验证数据集和所述知识蒸馏处理对应的误差函数，对所述迁移模型进行优化处理；使用所述参数微调数据集对所述迁移模型进行自监督训练，以对所述迁移模型的参数进行微调。采用上述技术手段，解决现有技术中，缺少机器人模型迁移的方法的问题。

2023-07-25

602KB

图像迁移方法和图像迁移模型的训练方法、装置.pdf

本公开提供了一种图像迁移方法和图像迁移模型的训练方法、装置、设备、介质，涉及人工智能领域，具体涉及深度学习和计算机视觉技术领域，可应用于人脸图像处理、人脸识别等场景。图像迁移方法包括：提取第一图像包括的第一对象的第一属性特征；根据针对第一图像的音频数据，提取第一对象包括的第一目标部位的第一形状特征；提取第二图像包括的第二对象的第一身份特征；以及基于第一属性特征、第一形状特征和第一身份特征生成第一迁移图像，第一迁移图像包括具有第一属性特征和第一形状特征的第二对象。

2023-07-24

1.2MB

图像迁移方法和图像迁移模型的训练方法、装置.pdf

本公开提供了一种图像迁移方法和图像迁移模型的训练方法、装置、设备、介质，涉及人工智能领域，具体涉及深度学习和计算机视觉技术领域，可应用于人脸图像处理、人脸识别等场景。图像迁移方法包括：根据第一对象的目标部位在第一图像中的第一位置信息和第一图像，分别提取第一对象的第一属性特征和目标部位的第一形状特征；提取第二图像包括的第二对象的第一身份特征；以及基于第一属性特征、第一形状特征和第一身份特征生成第一迁移图像，该第一迁移图像包括具有第一属性特征和第一形状特征的第二对象。

2023-07-24

1MB

图像风格迁移模型的训练方法、图像风格迁移方法及装置.pdf

本公开关于一种图像风格迁移模型的训练方法、图像风格迁移方法、装置、电子设备及存储介质，该图像风格迁移模型的训练方法包括：获取样本图像；样本图像至少包括第一样本图像和第二样本图像，第一样本图像由第二样本图像经过下采样处理得到；获取第一样本图像对应的第一目标风格图像，根据第一样本图像和第一目标风格图像，对第一神经网络模型进行训练，得到第一图像风格迁移模型；根据第一图像风格迁移模型，得到第二样本图像对应的第二目标风格图像；根据第二样本图像和第二目标风格图像，对第二神经网络模型进行训练，得到目标图像风格迁移模型。

2023-07-24

657KB

模型迁移方法、装置及电子设备.pdf

一种模型迁移方法及装置，所述方法包括：基于源场景中的第一训练样本数据、与第一训练样本数据对应的样本标签对所述模型进行模型训练，得到训练完成的所述决策树模型；基于目标场景中的无样本标签对应的第二训练样本数据，对训练完成的所述决策树模型中的每个决策树分别进行剪枝处理，以完成将所述决策树模型从源场景迁移至目标场景。一方面，解决了目标场景无标签情况下模型初始化的问题，并提升迁移模型在目标场景的泛化效能；另一方面，仅需将源场景训练的决策树模型的模型参数输出到目标场景，无需要使用源场景下的数据，满足了数据安全和隐私保

2023-05-25

721KB