预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111079944A(43)申请公布日2020.04.28(21)申请号201911310373.8(22)申请日2019.12.18(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人方文静王力(74)专利代理机构北京风雅颂专利代理有限公司11403代理人李莎(51)Int.Cl.G06N20/00(2019.01)权利要求书3页说明书10页附图3页(54)发明名称迁移学习模型解释实现方法及装置、电子设备、存储介质(57)摘要本发明提供了一种提升树模型迁移学习的解释方案,能够对基于提升树模型的迁移学习进行解释,同时可以支持迁移模型的局部解释和全局解释。CN111079944ACN111079944A权利要求书1/3页1.一种迁移学习模型解释实现方法,其特征在于,包括:使用源域中的样本训练得到源模型;记录所述源模型的解释性数据;根据所述源模型,使用目标域中的样本继续训练所述源模型,得到目标模型;记录所述目标模型的解释性数据;根据所述源模型的解释性数据及所述目标模型的解释性数据,处理得到所述迁移学习模型解释结果。2.根据权利要求1所述的方法,其特征在于,所述源模型和目标模型均为梯度提升决策树模型;所述解释性数据包括每个决策树的叶子节点的分值、每个决策树的每个节点上的样本数、每个决策树的中间节点的分裂特征的分裂增益。3.根据权利要求2所述的方法,其特征在于,所述源域和目标域中的样本均具有标定标签值;所述叶子节点的分值为所述梯度提升决策树模型在训练过程中基于分入该叶子节点中的多个样本的标定标签值而确定的。4.根据权利要求2所述的方法,其特征在于,记录所述源模型的解释性数据的步骤之后,还包括:使用所述目标域中的样本对所述源模型进行修正,得到修正后的源模型;记录所述修正后的源模型的解释性数据。5.根据权利要求4所述的方法,其特征在于,根据所述源模型的解释性数据及所述目标模型的解释性数据,处理得到所述迁移学习模型解释结果,包括:根据所述源模型的解释性数据和修正后的源模型的解释性数据,计算每个分裂特征在所述源模型中的全局解释性数据与在所述修正后的源模型中的全局解释性数据之间的第一变化值;将各分裂特征的所述第一变化值进行排序,得到反映源域的样本数据集核心分裂特征的分布变化情况的模型解释结果。6.根据权利要求5所述的方法,其特征在于,根据所述源模型的解释性数据及所述目标模型的解释性数据,处理得到所述迁移学习模型解释结果,包括:根据所述源模型的解释性数据和目标模型的解释性数据,计算每个分裂特征在所述源模型中的全局解释性数据与在所述目标模型中的全局解释性数据之间的第二变化值;将各分裂特征的所述第二变化值进行排序,解释反映迁移学习中核心分裂特征的分布变化情况的模型解释结果。7.根据权利要求5所述的方法,其特征在于,根据所述源模型的解释性数据及所述目标模型的解释性数据,处理得到所述迁移学习模型解释结果,包括:根据所述目标模型的解释性数据和修正后的源模型的解释性数据,对在排除修正后的源模型后的所述目标模型中各分裂特征的全局解释性数据进行排序,得到反映目标域的样本数据集核心分裂特征的变化或新增情况的模型解释结果。8.根据权利要求2-7任一项所述的方法,其特征在于,所述全局解释性数据为所述梯度提升决策树模型的特征分裂增益平均值;所述特征分裂增益平均值为所述梯度提升决策树模型中的所有决策树中的以目标特征为分裂特征的节点的分裂增益的平均值;所述分裂增益为所述决策树的分裂原理所基于的参数值。2CN111079944A权利要求书2/3页9.根据权利要求2所述的方法,其特征在于,根据所述源模型的解释性数据及所述目标模型的解释性数据,处理得到所述迁移学习模型解释结果,包括:从所述源模型的解释性数据及所述目标模型的解释性数据中提取得到所述源模型的局部解释性的统计数据和所述目标模型的局部解释性的统计数据;根据所述源模型的局部解释性的统计数据和所述目标模型的局部解释性的统计数据,对单条数据的迁移学习影响进行解释,得到局部解释性的模型解释结果。10.根据权利要求2所述的方法,其特征在于,所述源域中的样本为在第一时间段内的第一用户群体产生的用户消费行为数据,所述目标域中的样本为在第二时间段内的第二用户群体产生的用户消费行为数据,所述源模型和目标模型均用于预测目标用户的消费行为发生几率;所述分裂特征包括用户点击商品个数、商品品类、商品品牌、单次浏览的最大页数、用户与商品的平均交互时间中的至少一种。11.一种迁移学习模型解释实现装置,其特征在于,包括:源模型训练模块,用于使用源域中的样本训练得到源模型;源模型数据记录模块,用于记录所述