预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共30页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113609193A(43)申请公布日2021.11.05(21)申请号202110921813.4(22)申请日2021.08.11(71)申请人中国工商银行股份有限公司地址100140北京市西城区复兴门内大街55号(72)发明人赵燕子陈永录宋军超(74)专利代理机构中科专利商标代理有限责任公司11021代理人孙蕾(51)Int.Cl.G06F16/2458(2019.01)G06Q30/02(2012.01)G06Q40/04(2012.01)G06K9/62(2006.01)权利要求书3页说明书21页附图5页(54)发明名称训练用于预测客户交易行为的预测模型的方法及装置(57)摘要本公开提供了一种训练用于预测客户交易行为的预测模型的方法及装置,本公开涉及人工智能技术领域,可用于金融技术领域。该方法包括:根据客户样本数据集确定多个预选特征类型,其中客户样本数据集包括客户基本信息数据、以及客户针对目标产品的电话咨询信息数据;从多个预选特征类型中确定多个目标特征类型,其中目标特征类型为对客户购买行为结果的贡献度大于预设贡献度阈值、且每两个目标特征类型之间的相关性小于预设相关性阈值的数据类型;从客户样本数据集中筛选出与目标特征类型相关的数据,以生成目标训练集;以及采用目标训练集训练预设算法,以生成预测模型。CN113609193ACN113609193A权利要求书1/3页1.一种训练用于预测客户交易行为的预测模型的方法,包括:根据客户样本数据集确定多个预选特征类型,其中所述客户样本数据集包括客户基本信息数据、以及客户针对目标产品的电话咨询信息数据;从多个所述预选特征类型中确定多个目标特征类型,其中所述目标特征类型为对客户购买行为结果的贡献度大于预设贡献度阈值、且每两个所述目标特征类型之间的相关性小于预设相关性阈值的数据类型;从所述客户样本数据集中筛选出与所述目标特征类型相关的数据,以生成目标训练集;以及采用所述目标训练集训练预设算法,以生成预测模型。2.根据权利要求1所述的方法,其中,从多个所述预选特征类型中确定多个目标特征类型包括:从多个所述预选特征类型中去除无区分度特征类型,以获得多个目标预选特征类型,其中所述无区分度特征类型为对客户购买行为结果无贡献的数据类型;从多个所述目标预选特征类型中确定多个所述目标特征类型。3.根据权利要求2所述的方法,其中,从多个所述目标预选特征类型中确定多个所述目标特征类型包括:从多个所述目标预选特征类型中确定多个初选目标特征类型,其中所述初选目标特征类型为对客户购买行为结果的贡献度大于所述预设阈值的数据类型;计算多个所述初选目标特征类型中每两个所述初选目标特征类型之间相关性;将所述相关性大于等于所述预设相关性阈值的初选目标特征类型确定为相关特征类型、以及将所述相关性小于所述预设相关性阈值的初选目标特征类型确定为非相关特征类型;根据所述相关性从多个所述相关特征类型中选取一个最优相关特征类型;将所述最优相关特征类型和所述非相关特征类型组合,以组成所述目标特征类型。4.根据权利要求1所述的方法,其中,所述预设算法为决策树算法,所述预测模型为决策树模型;采用所述目标训练集训练预设算法,以生成预测模型包括:采用所述目标训练集训练所述决策树算法,以生成初始决策树模型;对所述初始决策树模型进行剪枝操作,以生成所述决策树模型。5.根据权利要求4所述的方法,对所述初始决策树模型进行剪枝,以生成所述决策树模型包括:分别对所述初始决策树模型中的每个非叶子节点执行剪枝操作,以生成多个预剪枝决策树模型,所述剪枝操作是将所述非叶子节点对应的子树替换为叶子节点;将所述目标训练集分为训练子集和测试子集;分别将所述训练子集和所述测试子集输入每个所述预剪枝决策树模型、以及分别将所述训练子集和所述测试子集输入所述初始决策树模型,以获取每个所述预剪枝决策树模型对应的整体损失函数值;将所述整体损失函数值满足预设数值条件的所述预剪枝决策树模型确定为所述决策树模型。2CN113609193A权利要求书2/3页6.根据权利要求1所述的方法,其中,所述预设算法为AdaBoost算法;采用所述目标训练集训练预设算法,以生成预测模型包括:确定所述预测模型中的基分类器的预设数量;采用所述目标训练集训练所述AdaBoost算法,以生成预测模型,其中所述预测模型由预设数量的所述基分类器按照各自的权重组合而成。7.根据权利要求6所述的方法,其中,所述确定所述预测模型中的基分类器的预设数量包括:确定所述基分类器的初始数量;以所述初始数量为基础,分别逐一增加所述基分类器的数量,以分别将所述基分类器按照逐一增加后的数量组合形成多个初始预测模型:获取所述初始预测模型的预测错误率和所述初