预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113902551A(43)申请公布日2022.01.07(21)申请号202111222187.6(22)申请日2021.10.20(71)申请人长安汽车金融有限公司地址400000重庆市江北区永平门街14号27-1、28-1、29-1(72)发明人李志立曹家楷赵轩张胜庆(74)专利代理机构北京信远达知识产权代理有限公司11304代理人李兆轩(51)Int.Cl.G06Q40/02(2012.01)G06Q30/00(2012.01)G06K9/62(2006.01)权利要求书2页说明书8页附图3页(54)发明名称车贷申请欺诈识别的方法和设备(57)摘要本发明提出一种车贷申请欺诈识别的方法和设备,基于xgboost模型进行机器学习,并提出xgboost模型的调参方法,进行欺诈识别时首先获取多笔车贷申请业务对应的数据,从数据中提取特征变量和欺诈标记构建为样本集;然后利用样本集对xgboost模型的超参数进行调参确定每个超参数的最优值,训练和测试经过调参的xgboost模型;最后对待识别的车贷申请业务的对应数据进行数据清理和提取特征变量,将其转换为xgboost模型的合格输入,输入到训练好的xgboost模型即可获得欺诈预测结果。本发明能够提升模型训练效率,并且提高了欺诈预测的准确率,达到了精确识别欺诈客户的目的,可极大节约审核人力成本和欺诈处置成本。CN113902551ACN113902551A权利要求书1/2页1.一种车贷申请欺诈识别方法,其特征在于,包括如下步骤:步骤一、获取多笔车贷申请业务对应的数据,将每笔车贷申请业务对应的数据进行数据清理后提取特征变量,并根据履约情况标记出每笔车贷申请业务是否存在欺诈,将处理得到的每笔车贷申请业务的特征变量和欺诈标记构建为样本集;步骤二、选择xgboost模型并依次通过i次调整直到完成对xgboost模型的11个超参数的调参,i为正整数且1<i≤11,每次调整完成至少1个超参数的调参;其中进行第j次调整的具体方法为,j为正整数且j∈[1,i]:A1、将已经完成前j‑1次调参的超参数设置为调参后确定的最优值,其余超参数中除了需要在第j次调整中进行调参的超参数外都设置为默认值;A2、确定需要在第j次调整中进行调参的超参数的不同候选值,并根据所述样本集对所有候选值进行模型训练,选取训练表现最好的候选值作为需要在第j次调整中进行调参的超参数的最优值;步骤三、根据所述步骤一构建的样本集训练和测试经过所述步骤二调参后的xgboost模型;步骤四、对待识别的车贷申请业务的对应数据进行数据清理后提取特征变量,并输入至所述步骤三训练和测试完成的xgboost模型中,得到待识别的车贷申请业务是否存在欺诈的预测结果。2.根据权利要求1所述的车贷申请欺诈识别方法,其特征在于,所述i取7,第一次调整时获取超参数n_estimators的最优值;第二次调整时获取超参数max_depth和超参数min_child_weight的最优值;第三次调整时获取超参数gamma的最优值;第四次调整时获取超参数subsample和超参数colsample_bytree的最优值;第五次调整时获取超参数reg_alpha和超参数reg_lambda的最优值;第六次调整时获取超参数max_delta_step和超参数scale_pos_weight的最优值;第七次调整时获取超参数learning_rate的最优值。3.根据权利要求2所述的车贷申请欺诈识别方法,其特征在于,所述超参数n_estimators的候选值参数集为[200,300,400],所述超参数max_depth的候选值参数集为[2,3,4,5],所述超参数min_child_weight的候选值参数集为[1,2,3,4,5],所述超参数gamma的候选值参数集为[0,0.1,0.3,0.5],所述超参数subsample的候选值参数集为[0.7,0.8,0.9],所述超参数colsample_bytree的候选值参数集为[0.7,0.8,0.9,1],所述超参数reg_alpha的候选值参数集为[0,0.05,0.1,1],所述超参数reg_lambda的候选值参数集为[0,0.05,0.1,1],所述超参数max_delta_step的候选值参数集为[0,0.1,1],所述超参数scale_pos_weight的候选值参数集为[1,10,20],所述超参数learning_rate的候选值参数集为[0.01,0.1,0.3,0.5]。4.根据权利要求1所述的车贷申请欺诈识别方法,其特征在于,将所述步骤一构建的样本集按照时间划分为全部训练集和测试集,再将所述全部训练集划分为部分训练集和验证