预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115934686A(43)申请公布日2023.04.07(21)申请号202210903160.1(22)申请日2022.07.29(71)申请人号百信息服务有限公司地址200085上海市虹口区四川北路61号13-19楼(72)发明人周晓辉王华超(74)专利代理机构上海浦科知识产权代理有限公司31400专利代理师武静(51)Int.Cl.G06F16/215(2019.01)G06F16/25(2019.01)G06N3/04(2006.01)权利要求书2页说明书8页附图1页(54)发明名称通信客户流失预警的方法、装置、电子设备及存储介质(57)摘要本发明涉及一种通信客户流失预警的方法、装置、电子设备及存储介质。通信客户流失预警的方法包括步骤:S1、数据清洗,对包括客户的通信数据进行ETL数据清洗;S2、融合生产模型原始数据集;S3、采用自适应综合过采样算法对S1中原始数据集进行综合采样,生成模型样本数据集;S4、在训练集上划分a%的样本训练集和1‑a%的留出集,进行第一层模型训练输出新训练集特征值和新测试集预测值;S5、基于LightGBM算法构建第二层模型,将新训练集特征值和新测试集特征值输入LightGBM模型,经训练后输出满足预先设定模型精度的模型;S6、Blending融合模型输出潜在流失客户清单。依据本发明的通信客户流失预警的方法可以提高存量客户流失率预测概率,根据预测结果筛选出潜在流失客户。CN115934686ACN115934686A权利要求书1/2页1.一种通信客户流失预警的方法,包括如下步骤:S1、数据清洗,对包括客户的通信套餐资费数据、通信行为数据、信令话单数据进行ETL数据清洗,所述ETL数据清洗包括数据抽取、数据转换和数据加载;对客户ID进行数据的碰撞关联,针对存在缺失值的字段,进行均值填充和众数填充操作,进而通过数据关联融合得到模型所需的原始数据集,其中,所述客户ID为手机号码进行加密后的字符串;S2、融合生产模型原始数据集,融合通信资费数据、通信行为数据和信令话单数据,获取模型原始数据集;S3、生成模型样本数据集,采用自适应综合过采样(ADASYN)算法对S1中原始数据集进行综合采样,形成模型样本数据集,将模型样本按x:y比例将所述模型样本数据集划分为训练集和测试集,其中,x∈[1,9],y∈[1,9],x、y为正整数,且满足x+y=10;S4、第一层模型训练,在训练集上划分a%的样本训练集,其余1‑a%为留出集,将a%的样本训练集分别采用包括XGboost模型、NGboost模型、Catboost模型、RF模型、DNN模型和LSTM模型的基模型进行模型训练,形成第一层基础分类器模型;将所述训练集上1‑a%留出集和全部所述测试集分别输入包括XGboost模型、NGboost模型、Catboost模型、RF模型、DNN模型和LSTM模型的第一层基础分类器模型,由第一层基础分类器模型的各基模型分别输出训练集预测值集合和测试集预测值集合;第一层基分类器输出的训练集预测值集合进行合并形成新训练集特征值,将第一层基分类器输出的测试集预测值集合进行合并形成新测试集预测值;S5、第二层模型训练,基于LightGBM算法构建第二层模型,将所述新训练集特征值和所述新测试集特征值输入LightGBM模型,经训练后输出满足预先设定模型精度的模型,然后进行生产环境服务器部署;S6、Blending融合模型输出潜在流失客户清单。2.如权利要求1所述的方法,其中,在步骤S5中,因LightGBM模型超参数较多,采用蝙蝠优化算法优化超参数的取值范围,用于提升模型的预测准确度及稳健性。3.如权利要求1所述的方法,其中,步骤S3还包括:基于样本数据集提取模型需要的特征变量,其中,所述特征变量取一定时间内客户通信行为相关的数据,所述特征变量包括电话号码、一定时间内的套餐费用、账户余额、流量使用量、主/被叫次数、通话时长、入网时间。4.如权利要求1所述的方法,其中,步骤S4到步骤S6中,在融合模型上采用Blending算法,所述融合模型包括两层模型架构,其中,第一层模型架构将训练样本集上构建一个留出集,采用剩下的数据训练每个基模型,然后采用基模型对所述留出集进行预测,输出预测值,第二层模型架构直接对所述预测值建模,生成第二层模型架构。5.如权利要求1所述的方法,还包括步骤:S7、步骤S6中输出的潜在流失客户清单,针对性的制定营销方案和挽留策略,所述营销方案和挽留策略包括免费体验套餐流量、积分送套餐,并持续跟踪业务场景应用中反馈数据。6.如权利要求5所述的方法,还包括步骤:S8、将步骤S7中的反馈数据更新到S1中的原始数据集,形成建模流程闭环。7.一种通信客户流失预警的