预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共169页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

数据挖掘与SPSSModeler (Clementine)Clementine数据挖掘使用 入门及实战 ■Shanghai(8621)53060345■Guangzhou(8620)382403850 目录 实战练习 建模技术 CLEM基 本操作 数据挖•可初步开展数据挖 掘概述掘工作 •掌握CLEM常用建-购物蓝分析 模技术-时序购买分析 掌握的基本 •CLEM-基本建模技术-药品使用规则分 操作析 -神经网络 -CLEM简介-···· •从整体上了解解-规则归纳 -读取数据文件*根据前面的数据,练 数据挖掘-模型比较与合并 -数据质量习数据分析挖掘过程 -数据挖掘介绍-KOHONEN网络 -数据处理介绍 -数据挖掘价值-关联规则 -寻找数据之间的关 -数据挖掘产品-时序分析 系 数据挖掘概述 数据挖掘介绍 数据挖掘价值 数据挖掘产品 什么是数据挖掘? •不同的定义 –从大量数据中发现非平凡的、先前不知道的、有价值的规律的过程 –从大量数据中自动化(或者半自动化)的发现有价值规律的过程 –按既定业务目标,对大量的企业数据进行探索,揭示隐藏其中的规律性, 并进一步将其模型化的先进、有效的方法。 •数据挖掘的其他名称 –数据库内知识发现(KDD-Knowledgediscoveryindatabases) –数据/模式分析 –商业智能 –人工智能 –…… 数据挖掘的起源 •来源于机器学习/人工智能、模式识别、统计学和数据库 •传统技术的局限性 –巨量的数据 –高维数据 –数据分布不理想 机器学习/ 统计学 模式识别 数据挖掘 数据库系统 为什么进行数据挖掘?商业观点 •业务中产生了大量的数据,这些数据存储在业务系统中却不能创造价值 –客户信息数据 –客户交易行为数据 –客户反馈数据 –网络数据 –…… •计算机变得越来越便宜、功能却越来越强大 •商业竞争越来越激烈,对客户了解越多就意味着机会越大 为什么进行数据挖掘?技术观点 •业务中的数据量呈现指数增长(GB/小时) •传统技术难以从这些大量数据中发现有价值的规律 •数据挖掘可以帮助我们从大量数据中发现有价值的规律 4,000,000 3,500,000 3,000,000TheData 2,500,000 2,000,000Gap 1,500,000Totalnewdisk(TB)since 1,000,0001995 500,000Numberof 0analysts 19951996199719981999 From:R.Grossman,C.Kamath,V.Kumar,“DataMiningforScientificandEngineeringApplications” 一个市场营销的例子 女性对市场活动做出 回应,男性对市场活 动不做出回应,和年 龄无关 在数据中发现有价值的规则或者模式 一个市场营销的例子 数据变的复杂会如何? 女性对市场活动做出回应, 老年男性也可能对市场活动 做出回应 一个市场营销的例子 通过数据挖掘发 现回应的5条规 则: 1、如果收入大 于29622,有孩 子,并且孩子的 数量小于等于2, 那么对市场活动 会回应 …… 通过数据挖掘发 现不回应的5条 规则: 1、如果收入小 于12640.3,并 且有一个孩子, 那么对市场活动 不会回应数据挖掘可以从异常复杂的数据中发现规律 …… 数据挖掘技术的分类 数据挖掘 描述预测 分类统计回归时间序列预测 可视化 聚类决策树 关联规则神经网络 顺序关联 汇总 数据挖掘概述 数据挖掘介绍 数据挖掘价值 数据挖掘产品 数据挖掘效果模拟分析 目的:发现新客户(使响应率从1%提高到1.2%) 数据挖掘以前数据挖掘以后差别投入 减少 发信的数量1,000,000750,000(250,000) 成本$1,000,000$750,000($250,000) 响应的数量10,0009,000(1,000) 每个响应的收入$125$125$0 总收入$1,250,000$1,125,000($125,000) 净利润$250,000$375,000$125,000 建模的费用040,000$40,000 最终的利润$250,000$335,000$85,000 收益 增加 数据挖掘收益分析 向60%的客户发信,得到了90%的收益 数据挖掘的意义 利润分析图 盈亏平 衡加速亏 损 超额利 润 成功案例 面临问题:怎样扩展和现有客户关系?怎么控制营销费用提升利润? 解决方案:建立关联预测模型来发现交叉销售和"翻滚"销售机会。 应用效果:产品销售提高50%营销费