预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113222177A(43)申请公布日2021.08.06(21)申请号202110510119.3(22)申请日2021.05.11(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人章鹏苏煜阮怀玉(74)专利代理机构北京博思佳知识产权代理有限公司11415代理人周嗣勇(51)Int.Cl.G06N20/00(2019.01)G06F21/62(2013.01)权利要求书2页说明书15页附图2页(54)发明名称模型迁移方法、装置及电子设备(57)摘要公开一种模型迁移方法及装置,所述模型为评分卡模型,所述方法包括:基于源场景的第一训练样本、与第一训练样本数据对应的样本标签,训练得到与源场景对应的第一机器学习模型;获取目标场景的无标签的第二训练样本;其中,所述第二训练样本与所述第一训练样本的特征空间相同;基于调整所述第二训练样本的特征分布逼近所述第一训练样本的特征分布,将所述第一机器学习模型的已训练好的模型参数进行校准,得到模型参数校准后的第二机器学习模型,以完成模型迁移。CN113222177ACN113222177A权利要求书1/2页1.一种模型迁移方法,所述模型为评分卡模型,所述方法包括:基于源场景的第一训练样本、与第一训练样本数据对应的样本标签,训练得到与源场景对应的第一机器学习模型;获取目标场景的无标签的第二训练样本;其中,所述第二训练样本与所述第一训练样本的特征空间相同;基于调整所述第二训练样本的特征分布逼近所述第一训练样本的特征分布,将所述第一机器学习模型的已训练好的模型参数进行校准,得到模型参数校准后的第二机器学习模型,以完成模型迁移。2.根据权利要求1所述的方法,所述基于源场景的第一训练样本、与第一训练样本数据对应的样本标签,训练得到与源场景对应的第一机器学习模型,包括:对所述第一训练样本进行数据分箱处理,得到第一数据分箱及其对应的第一特征占比数据;其中,所述第一特征占比数据表征第一数据分箱的第一特征的样本在所述第一训练样本中的样本占比;基于将第一数据分箱中的样本向量化输入至所述第一机器学习模型,并以所述第一样本对应的样本标签作为约束对所述第一机器学习模型进行模型训练,得到训练完成的包括第一模型参数的所述第一机器学习模型。3.根据权利要求2所述的方法,所述第一模型参数包括与所述第一样本占比数据对应的第一数据分箱的分箱取值范围;所述基于调整所述第二训练样本的特征分布逼近所述第一训练样本的特征分布,将所述第一机器学习模型的已训练好的模型参数进行校准,得到模型参数校准后的第二机器学习模型,包括:对所述第二训练样本进行数据分箱处理,得到第二数据分箱及其对应的第二样本特征占比数据;其中,所述第二样本特征占比数据表征第二数据分箱的第一特征的样本在所述第二训练样本中的样本占比;按照预设步长,探索调整所述第二数据分箱的分箱取值范围,以使所述第二样本特征占比数据作为所述第二训练样本的特征分布,逼近以所述第一样本特征占比数据作为所述第一训练样本的特征分布;将探索得到的所述第二数据分箱的分箱取值范围替代所述第一模型参数中的所述第一数据分箱的分箱取值范围,并保持所述第一模型参数中的其它模型参数不变,以完成模型参数将校准,将模型参数将校准后的所述第一机器学习模型作为所述第二机器学习模型。4.根据权利要求3所述的方法,还包括:输出所述第二机器学习模型,以使用户基于输出的模型迁移后的所述第二机器学习模型在所述目标场景进行模型预测。5.根据权利要求2或3所述的方法,所述数据分箱包括等频分箱或等距分箱。6.根据权利要求3所述的方法,所述第二数据分箱的分箱粒度细于所述第一数据分箱的分箱粒度。7.一种模型迁移装置,所述模型为评分卡模型,所述装置包括:训练模块,基于源场景的第一训练样本、与第一训练样本数据对应的样本标签,训练得2CN113222177A权利要求书2/2页到与源场景对应的第一机器学习模型;获取模块,获取目标场景的无标签的第二训练样本;其中,所述第二训练样本与所述第一训练样本的特征空间相同;迁移模块,基于调整所述第二训练样本的特征分布逼近所述第一训练样本的特征分布,将所述第一机器学习模型的已训练好的模型参数进行校准,得到模型参数校准后的第二机器学习模型,以完成模型迁移。8.根据权利要求7所述的装置,所述训练模块进一步:对所述第一训练样本进行数据分箱处理,得到第一数据分箱及其对应的第一特征占比数据;其中,所述第一特征占比数据表征第一数据分箱的第一特征的样本在所述第一训练样本中的样本占比;基于将第一数据分箱中的样本向量化输入至所述第一机器学习模型,并以所述第一样本对应的样本标签作为约束对所述第