预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共23页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110795603A(43)申请公布日2020.02.14(21)申请号201911040223.X(22)申请日2019.10.29(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人陈超超王力周俊(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309代理人张静娟周良玉(51)Int.Cl.G06F16/901(2019.01)G06F21/62(2013.01)G06Q10/04(2012.01)权利要求书4页说明书15页附图3页(54)发明名称一种基于树模型的预测方法和装置(57)摘要本说明书实施例提供了一种保护隐私的树模型构建方法和装置及基于该树模型的预测方法和装置,所述构建方法包括:从至少两个数据方各自的设备获取M组分裂结果,M组分裂结果与M个特征分别对应;记录M组分裂结果各自对应的数据方;基于N个样本各自的标签值,分别计算各个分裂结果的分裂增益;获取具有最大分裂增益的分裂结果作为最优分裂结果;在最优分裂结果的分裂增益为正值的情况中,确定最优分裂结果对应的数据方;在对应的数据方为第二数据方的情况中,将最优分裂结果发送给第二数据方的设备,并记录第一节点与第二数据方的对应关系;对第一节点进行标注,以指示本地没有第一节点的节点数据,并相应地更新所述第一树的树结构。CN110795603ACN110795603A权利要求书1/4页1.一种树模型构建方法,其中,当前用于构建所述树模型的构建数据由至少两个数据方各自的设备拥有的数据组成,所述构建数据包括N个样本各自的M个特征的特征值,所述至少两个数据方中包括第一数据方和第二数据方,所述第一数据方的设备中具有N个样本各自的标签值,所述树模型中当前包括第一树,所述第一树中当前包括第一节点,所述方法由所述第一数据方的设备相对于所述第一节点执行,包括:从所述至少两个数据方各自的设备获取M组分裂结果,其中,所述M组分裂结果与所述M个特征分别对应,每组分裂结果中包括基于所述N个样本各自的相应特征的特征值进行分裂的多个分裂结果;记录所述M组分裂结果各自对应的数据方;基于N个样本各自的标签值,分别计算所述M组分裂结果中各个分裂结果的分裂增益;获取具有最大分裂增益的分裂结果作为最优分裂结果;在所述最优分裂结果的分裂增益为正值的情况中,基于本地记录的所述M组分裂结果各自对应的数据方,确定所述最优分裂结果对应的数据方;在所述对应的数据方为所述第二数据方的情况中,将所述最优分裂结果发送给所述第二数据方的设备,并记录所述第一节点与所述第二数据方的对应关系;对所述第一节点进行标注,以指示本地没有第一节点的节点数据,并相应地更新所述第一树的树结构。2.根据权利要求1所述的方法,其中,所述M组分裂结果中的每组分裂结果包括与相应特征对应的P个分裂结果,其中P基于N个样本中包括的该相应特征的非重复的特征值的个数确定。3.根据权利要求1所述的方法,还包括,通知至少两个数据方中除了所述第一数据方和所述第二数据方之外的其它数据方的设备,以指示所述其它数据方的设备对所述第一节点进行所述标注并相应地更新所述第一树的树结构。4.根据权利要求1所述的方法,其中,所述第一数据方还具有N个样本各自的第一特征的特征值,所述方法还包括,在所述对应的数据方是所述第一数据方的情况中,并且,在确定所述最优分裂结果为与第一特征对应的分裂结果的情况中,将所述第一特征确定为所述第一节点对应的特征,并将所述最优分裂结果对应的分裂值确定为所述第一节点的第一特征的分裂值,并通知所述至少两个数据方中除所述第一数据方之外的其它数据方的设备,以指示其它数据方的设备对所述第一节点进行所述标注,并相应地更新所述第一树的树结构。5.根据权利要求1所述的方法,还包括,在所述最优分裂结果的分裂增益小于等于零的情况中,基于所述N个样本各自的标签值计算所述第一节点对应的分值,并通知所述至少两个数据方中除所述第一数据方之外的其它数据方的设备,以指示其它数据方的设备对所述第一节点进行所述标注。6.根据权利要求1所述的方法,其中,所述第一树为所述树模型中的第t棵树,其中,基于N个样本各自的标签值,分别计算所述M组分裂结果中各个分裂结果的分裂增益包括,基于N个样本各自的标签值以及预先获取的所述树模型的第t-1棵树,分别计算所述M组分裂结果中各个分裂结果的分裂增益。7.根据权利要求1所述的方法,其中,所述M组分裂结果中包括从至少两个数据方各自2CN110795603A权利要求书2/4页的设备分别接收的重合的至少两个分裂结果,基于本地记录的所述M组分裂结果各自对应的数据方,确定所述最优分裂结果对应的数据方包括,在基于本地记