预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共18页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN110533459A(43)申请公布日2019.12.03(21)申请号201910727070.X(22)申请日2019.08.07(71)申请人中国联合网络通信集团有限公司地址100033北京市西城区金融大街21号(72)发明人张帆宋春涛程新洲(74)专利代理机构北京中博世达专利商标代理有限公司11274代理人申健(51)Int.Cl.G06Q30/02(2012.01)G06N20/20(2019.01)权利要求书3页说明书10页附图4页(54)发明名称一种基于梯度提升算法的终端更换概率预测方法及装置(57)摘要本申请公开了一种基于梯度提升算法的终端更换概率预测方法及装置,涉及通信领域,用于预测未来一段时间内用户更换终端的概率。包括:从运营商系统中获取多个用户一段时间内相关数据并生成训练集和验证集;利用训练集对梯度提升算法模型进行训练;其中,每进行一轮训练后,生成验证集损失值,并根据验证集损失值,调节下一轮训练中梯度提升算法模型的学习率;梯度提升算法模型的学习率随验证集损失值的降低而降低;梯度提升算法模型训练结束后,根据训练好的梯度提升算法模型生成第二模型;利用第二模型进行预测,生成用户未来一段时间内终端更换概率。本申请实施例应用于预测用户终端更换。CN110533459ACN110533459A权利要求书1/3页1.一种基于梯度提升算法的终端更换概率预测方法,其特征在于,包括:从运营商系统中获取多个用户一段时间内相关数据;根据所述相关数据,生成样本集;所述样本集具体包括:用户特征数据以及预测标签;所述用户特征数据,具体包括:前m个月内所述多个用户的用户个人信息、用户每月消费详情、用户每月套餐使用详情、用户终端相关信息、用户终端更换详情;所述预测标签,具体包括:后n个月内所述多个用户是否更换终端;将所述样本集中的所述多个用户中x1个用户样本作为训练集,所述多个用户中x2个用户样本作为验证集;初始化梯度提升算法模型和学习率;利用所述训练集对所述梯度提升算法模型进行训练;其中,每进行一轮训练后,生成验证集损失值,并根据所述验证集损失值,调节下一轮训练中所述梯度提升算法模型的学习率;其中,所述验证集损失值为利用训练好的梯度提升算法模型进行预测生成预测结果,然后利用所述验证集对所述预测结果进行验证生成的;所述梯度提升算法模型的学习率随所述验证集损失值的降低而降低;所述梯度提升算法模型训练结束后,根据训练好的梯度提升算法模型生成第二模型;利用所述第二模型进行预测,生成用户未来一段时间内终端更换概率。2.根据权利要求1所述的基于梯度提升算法的终端更换概率预测方法,其特征在于,所述根据训练好的梯度提升算法模型生成第二模型,具体包括:所述梯度提升算法模型训练结束后,利用所述验证集损失值最小值的一轮训练的学习率以及所述梯度提升算法模型的相关参数,生成第二模型。3.根据权利要求1所述的基于梯度提升算法的终端更换概率预测方法,其特征在于,所述用户特征数据,具体包括:用户年龄、用户性别、用户月均消费、用户月消费最大值、用户月消费最小值、用户月消费中位数、用户月均通话时长、用户月通话时长最大值、用户月通话时长最小值、用户月通话时长中位数、用户月均流量、用户月流量最大值、用户月流量最小值、用户月流量中位数、统计时段内用户使用终端价格的均值、统计时段内用户使用终端价格的最大值、统计时段内用户使用终端价格的最小值、统计时段内用户使用终端价格的中位数、统计时段内用户更换终端的次数、第一终端类型、第二终端类型、最近一次终端价格区间、最近一次终端品牌;所述第一终端类型,为用户最近一次使用终端的网络制式;所述第二终端类型,为用户最近一次使用终端的产品类型。4.根据权利要求3所述的基于梯度提升算法的终端更换概率预测方法,其特征在于,所述方法还包括:当所述用户未来一段时间内终端更换概率达到预设值时,最终结果为用户未来一段时间内会更换终端;当所述用户未来一段时间内终端更换概率没有达到预设值时,最终结果为用户未来一段时间内不会更换终端。5.根据权利要求4所述的基于梯度提升算法的终端更换概率预测方法,其特征在于,所述初始化梯度提升算法模型,具体包括:2CN110533459A权利要求书2/3页所述梯度提升算法模型初始化函数为:其中,m为训练样本数量,y(i)为预测标签值。6.一种基于梯度提升算法的终端更换概率预测装置,其特征在于,所述装置包括获取单元、计算单元及生成单元;所述获取单元,用于从运营商系统中获取多个用户一段时间内相关数据;根据所述相关数据,生成样本集;所述样本集具体包括:用户特征数据以及预测标签;所述用户特征数据,具体包括:前m个月内所述多个用户的用户个人信息、用户每月消费详情、用