预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共17页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114139718A(43)申请公布日2022.03.04(21)申请号202111341408.1(22)申请日2021.11.12(71)申请人上海冰鉴信息科技有限公司地址200000上海市浦东新区自由贸易试验区商城路618号四层B207室(72)发明人顾凌云周轩张阳王震宇(74)专利代理机构成都顶峰专利事务所(普通合伙)51224代理人李崧岩(51)Int.Cl.G06N20/00(2019.01)权利要求书3页说明书9页附图4页(54)发明名称模型创建方法、装置及计算机可读存储介质(57)摘要本申请提供的模型创建方法、装置及计算机可读存储介质,通过原始样本数据组成的第一训练样本集,衍生特征数据组成的第二训练样本集,以及基于原始样本数据和衍生样本数据组成的第三训练样本集构建不同的集成树模型,通过不同集成树模型对测试样本集中的测试样本的测试,得到不同的模型评价指标,并通过该不同的模型评价指标确定最终的目标集成树模型。相对于一棵树而言,具有更强的数据表达能力,另外相对于线性模型也能发掘特征之间的非线性关系,如此通过上述方式确定的目标集成树模型可以更好的使特征表达数据。CN114139718ACN114139718A权利要求书1/3页1.一种模型创建方法,其特征在于,应用于计算机设备,所述方法包括:将原始样本数据进行划分得到训练样本集与测试样本集;对所述训练样本集中的原始样本数据进行筛选,得到由筛选后原始样本数据组成的第一训练样本集;采用所述第一训练样本集建模得到第一集成树模型,并采用所述第一集成树模型对所述测试样本集中的测试样本进行测试,得到第一模型评价指标;采用所述第一集成树模型对所述第一训练样本集进行衍生处理,得到第二训练样本集;采用所述第二训练样本集建模得到第二集成树模型,并采用所述第二集成树模型对所述测试样本集中的测试样本进行测试,得到第二模型评价指标;基于所述第一训练样本集与所述第二训练样本集合并得到的第三训练样本集建模得到第三集成树模型,并采用所述第三集成树模型对所述测试样本集中的测试样本进行测试,得到第三模型评价指标;根据所述第一模型评价指标、第二模型评价指标及第三模型评价指标从所述第一集成树模型、第二集成树模型及第三集成树模型中确定出最优的集成树模型作为目标集成树模型。2.如权利要求1所述的模型创建方法,其特征在于,所述对所述训练样本集中的原始样本数据进行筛选,得到由筛选后原始样本数据组成的第一训练样本集的步骤,包括:针对所述训练样本集中的原始样本数据,采用k‑折交叉验证的方式筛选出最优参数下排序在预设名次且符合所述训练样本集所在业务逻辑的目标原始样本数据,由所述目标原始样本数据组成所述第一训练样本集。3.如权利要求1所述的模型创建方法,其特征在于,所述第一模型评价指标包括第一AUC值以及第一KS值,所述采用所述第一集成树模型对所述测试样本集中的测试样本进行测试,得到第一模型评价指标的步骤,包括:采用所述第一集成树模型对所述测试样本集中的测试样本进行打分,建立评价所述第一集成树模型的第一AUC值以及第一KS值;所述第二模型评价指标包括第二AUC值以及第二KS值,所述采用所述第二集成树模型对所述测试样本集中的测试样本进行测试,得到第二模型评价指标的步骤包括:采用所述第二集成树模型对所述测试样本集中的测试样本进行打分,建立评价所述第二集成树模型的第二AUC值以及第二KS值;所述第三模型评价指标包括第三AUC值以及第三KS值,所述采用所述第三集成树模型对所述测试样本集中的测试样本进行测试,得到第三模型评价指标的步骤包括:采用所述第三集成树模型对所述测试样本集中的测试样本进行打分,建立评价所述第三集成树模型的第三AUC值以及第三KS值。4.如权利要求3所述的模型创建方法,其特征在于,所述采用所述第一集成树模型对所述第一训练样本集进行衍生处理,得到第二训练样本集的步骤包括:基于集成树模型的自带接口或scikit‑learn接口通过所述第一集成树模型对所述第一训练样本集进行衍生处理,得到由衍生特征组成的所述第二训练样本集,其中,所述衍生特征为所述第一训练样本集中的训练样本在所述第一集成树模型中每颗树叶子节点上的2CN114139718A权利要求书2/3页索引值所组成的数组。5.如权利要求3所述的模型创建方法,其特征在于,所述根据所述第一模型评价指标、第二模型评价指标及第三模型评价指标从所述第一集成树模型、第二集成树模型及第三集成树模型中确定出最优的集成树模型作为目标集成树模型的步骤,包括:基于所述第一AUC值、第二AUC值及第三AUC值,结合所述第一KS值、第二KS值及第三KS值,从所述第一集成树模型、第二集成树模型及第三集成树模型中确定出最优