预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共20页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112801231A(43)申请公布日2021.05.14(21)申请号202110373889.8(22)申请日2021.04.07(71)申请人支付宝(杭州)信息技术有限公司地址310000浙江省杭州市西湖区西溪路556号8层B段801-11(72)发明人李盟李龙飞(74)专利代理机构北京亿腾知识产权代理事务所(普通合伙)11309代理人陈霁周良玉(51)Int.Cl.G06K9/62(2006.01)G06Q20/40(2012.01)权利要求书3页说明书12页附图4页(54)发明名称用于业务对象分类的决策模型训练方法和装置(57)摘要本说明书实施例提供一种用于业务对象分类的决策模型训练方法和装置。训练方法包括,首先获取样本总集和训练的约束条件;然后根据样本总集,通过节点分裂的方式构建决策树,其中针对任意的当前节点进行分裂的过程包括:对于当前节点的多个备选分裂条件中任一分裂条件,根据依照该分裂条件对当前节点进行分裂得到的两个子节点对于约束条件的符合程度,确定该分裂条件的约束适应度;根据该分裂条件的分裂纯度和所述约束适应度,确定该分裂条件的综合得分;根据多个备选分裂条件中综合得分最优的分裂条件,对当前节点进行分裂。然后基于上述决策树,确定用于对业务对象分类的决策模型。CN112801231ACN112801231A权利要求书1/3页1.一种用于业务对象分类的决策模型训练方法,包括:获取样本总集和训练的约束条件,其中样本总集中的单个样本包括,单个业务对象的属性特征,以及该业务对象是否属于目标业务分类的分类标签;根据所述样本总集,通过节点分裂的方式构建第一决策树,其中针对任意的当前节点进行分裂的过程包括:对于当前节点的多个备选分裂条件中任一分裂条件,根据依照该分裂条件对当前节点进行分裂得到的两个子节点对于所述约束条件的符合程度,确定该分裂条件的约束适应度;根据该分裂条件的分裂纯度和所述约束适应度,确定该分裂条件的综合得分;根据所述多个备选分裂条件中综合得分最优的分裂条件,对当前节点进行分裂;基于所述第一决策树,确定用于对业务对象分类的决策模型。2.根据权利要求1所述的方法,其中,针对任意的当前节点进行分裂的过程还包括:根据落入当前节点的当前样本集中,各业务对象的属性特征取值,确定所述多个备选分裂条件。3.根据权利要求2所述的方法,其中,所述属性特征包括数值型的多项属性特征;确定所述多个备选分裂条件,包括:枚举所述当前样本集中,所述多项属性特征具有的可能取值,将一项属性特征与该项属性特征的一个取值的组合作为一个备选分裂条件。4.根据权利要求1所述的方法,其中,所述约束条件包括,对样本预测的评价指标和该评价指标应符合的指标阈值;所述确定该分裂条件的约束适应度,具体包括:对于所述两个子节点中的任一子节点,确定按照该子节点对应的决策规则进行的样本预测对于所述评价指标的指标值,并根据所述指标值与所述指标阈值的对比,确定该子节点的约束符合度;将所述两个子节点各自的约束符合度中的较大者,确定为该分裂条件的约束适应度。5.根据权利要求4所述的方法,其中,所述评价指标包括以下之一:置信度,召回率,召回数,稳定性。6.根据权利要求4所述的方法,其中,根据所述指标值与所述指标阈值的对比,确定该子节点的约束符合度,具体包括:如果所述指标值符合所述指标阈值,则将该子节点的约束符合度确定为0;如果所述指标值不符合所述指标阈值,则取所述指标值和指标阈值的差值绝对值的相反数,作为该子节点的约束符合度。7.根据权利要求1所述的方法,其中,针对任意的当前节点进行分裂的过程还包括:根据当前节点对应的当前样本集的样本纯度,所述两个子节点分别对应的两个样本子集的样本纯度,确定该分裂条件的分裂纯度。8.根据权利要求7所述的方法,其中,所述样本纯度基于以下指标之一而确定:信息熵,基尼系数。9.根据权利要求7所述的方法,其中,所述确定该分裂条件的分裂纯度,具体包括:以所述两个样本子集各自的样本数目与所述当前样本集的样本数目的比例为各自的权重,对所述两个样本子集的样本纯度进行加权求和,得到和值;基于所述当前样本集的样本纯度与所述和值之差,确定该分裂条件的分裂纯度。10.根据权利要求1所述的方法,其中,根据该分裂条件的分裂纯度和所述约束适应度,确定该分裂条件的综合得分,包括:2CN112801231A权利要求书2/3页分别以第一权重和第二权重为权重因子,对所述分裂纯度和所述约束适应度进行加权求和,得到所述综合得分。11.根据权利要求10所述的方法,其中,所述第一权重根据所述多个备选分裂条件分别对应的多个分裂纯度的第一方差而确定,且与第一方差负相关;所述第二权重根据所述多个备选分裂条件分别对应的多个约束