预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

电信客户流失数据挖掘论文1数据挖掘概述数据挖掘(DataMining)是一种决策支持的过程是从看似杂乱无章的海量数据中利用人工智能、模式识别、机器学习、数据库、统计学等技术高效的分析企业庞大的数据库从中找出有价值的事件进行合理的归纳性推理挖掘出潜在的模式帮助决策者做出正确的决策。2客户流失的概述2.1客户流失的理解流失的客户分为主动流失和被动流失。主动流失是因为客户自身的原因导致的流失例如各个运营商之间的竞争客户的搬迁、学生毕业等因素。被动流失是指客户由于欠费时间较长或者与运营商签订的合同到期后不再续约等因素从而运营商终止向客户提供服务的行为。对于铜川联通公司把用户状态为“锁定期”、“强拆销号”、“退网停机”、“预登录停机”、“欠费服务暂停”等定义为流失的客户或即将流失的客户。数据挖掘的目标是通过挖掘出来的结果降低客户流失率分析各项因素对客户流失的影响用最小的成本最大程度的挽留客户。2.2电信客户流失分析的特点(1)电信客户的数据量大、实时性强、逻辑复杂使用历史数据来进行数据挖掘结果往往会存在较大的偏差。(2)数据预处理工作需要收集大量杂乱无章的原始数据来进行处理工作量非常大通常需要花费一个项目大多数的时间。(3)国内电信企业的客户流失率大约在1%~3%左右不适合直接采用某种模型而需要增加流失客户的比例但这样就会存在抽样过度的风险。(4)需要考虑到多方面的平衡:首先预测的准确性并兼顾可理解性;其次营销成本的收益问题和客户挽留的价值。3电信企业客户流失分析的数据挖掘过程3.1数据挖掘的模型选择在实践应用中神经网络算法和决策树算法在客户流失预测的问题上都具有较高的精确度和准确性。3.1.1决策树算法决策树的优点:能够形成容易理解的规则并且能很好的进行归纳分类;缺点:预处理较多对于数据信息不能充分利用在数据类别较多的情况下错误率也高。3.1.2神经网络算法神经网络的优点:在自适应、自组织、自学习等能力较强抗干扰能力和互补性也较强。缺点:解释性差。决策树算法和神经网络算法各有特点但对于解决客户流失的问题而言决策树算法更容易被人们理解和接受但在预测结果的准确性和精确度较差而神经网络算法可以弥补这一缺点提高预测模型的准确度。因此在实践当中如果将两种算法结合起来应用那么会对预测客户流失的实际效果方面起到更大的作用。3.2数据准备数据挖掘项目中数据准备阶段及其重要在整个挖掘坏境中也工作量最大。本次研究中采取的是陕西铜川联通公司2013年11月的数据数据量庞大主要来自计费系统其中包括客户基本信息、消费行为特征、通话行为特征欠费等。4结束语要在庞大的数据中找出有流失倾向和流失的客户几乎是不可能的事在使用SPSS/Clementine进行数据挖掘建模后客户挖掘的准确率达到98%为电信企业做出决策起到很大的作用从而可以制定相应措施挽留一些有价值的客户。数据挖掘技术在电信行业的广泛应用将会使更多的电信企业从源头上缓解客户流失所带来的损失能在很大程度上避免许多损失在激烈的市场竞争中立于不败之地。作者:杨逸凡赵夏单位:兰州财经大学