预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

授课内容项目六SPSSModeler数据挖掘(项目,任务)任务1决策树教学目标:1.理解决策树模型的原理。2.掌握决策树的操作方法。教学重点、难点:重点:掌握决策树的操作方法。难点:理解决策树模型的原理。补充内容和教学内容及过程设计时间分配一、决策树算法简介(10分钟)二、决策树分析引例1.决策树基本模型(10分钟)子任务1:新建“决策树.str”数据流,导入“学生数据.xlsx”(见本书配套资源),利用决策树5.0算法生成决策树,研究哪些因素会显著影响学生参与社会公益活动,其中“是否参与公益活动”为目标字段,其余字段为输入字段。【步骤1】~【步骤10】2.“boosting”决策树优化模型(10分钟)子任务2:新建“决策树优化.str”数据流,导入“电信客户数据.sav”,利用决策树5.0算法生成决策树,并利用boosting建立3个关联模型进行优化,研究哪些因素显著影响客户流失,其中“流失”为目标字段,其余字段为输入字段(除了“收入”“教育程度”和“年龄”字段)。【步骤1】~【步骤13】任务实训新建“规则集.str”数据流,导入“学生数据.xlsx”(见本书配套资源),利用决策树5.0算法生成规则集,研究哪些因素显著影响学生是否参与社会公益活动,其中“是否参与公益活动”为目标字段,其余字段为输入字段。(提示:在“决策树”节点中,不选择默认的“决策树”,而选择“规则集”。)课后总结分析:授课内容项目五SPSSModeler数据挖掘(项目,任务)任务2因子分析教学目标:1.理解因子分析模型的原理。2.掌握因子分析的操作方法。教学重点、难点:重点:掌握因子分析的操作方法。难点:理解因子分析模型的原理。补充内容和教学内容及过程设计时间分配一、因子分析简介(10分钟)二、因子分析步骤(1)前提条件:原有变量具有相关性。如果原有变量独立,没有相关关系,则很难提取公共信息。(2)因子提取:从原有变量中提取出几个公共信息(公共因子)。(10分钟)(3)因子命名:对公共因子进行命名,让公共因子具备实际意义。(4)因子权重:根据各个公共因子的特征根,计算各个公共因子的权重。(5)因子得分:计算各个样本在各个公共因子上的得分,根据公共因子的权重,进一步计算综合因子的得分。子任务1:新建“因子提取.str”数据流,导入“电信客户数据.sav”,分析电信客户消费影响因素。(30分钟)(1)筛选“年龄”“收入”“家庭人数”“开通月数”“基本费用”“宽带费用”“流量费用”变量。(2)利用因子分析建模,不采用因子旋转时,查看公共因子的结果。(3)利用因子分析建模,采用因子旋转,并对公共因子命名,计算各个公共因子的权重。【步骤1】~【步骤18】子任务2:将子任务1“因子提取.str”数据流另存为为“因子得分.str”,对客户的营销价值进行排序。(1)计算各个公共因子的权重。(20分钟)(2)新建一个字段“因子得分”,并根据各个公共因子的权重来计算。(3)按照综合因子得分字段降序排序。(4)将因子得分字段移至第一个字段,便于查看营销价值最高的客户。【步骤1】~【步骤13】任务实训新建“练习.str”数据流,导入“经济指标.sav”(见本书配套资源),对各地区多个经济(20分钟)指标进行公共因子提取,并分析哪些地区在各个公共因子上得分较高。课后总结分析:授课内容项目五SPSSModeler数据挖掘(项目,任务)任务3关联分析教学目标:1.理解关联分析模型的原理。2.理解支持度和置信度的作用。3.掌握关联分析的操作方法。教学重点、难点:重点:掌握关联分析的操作方法。难点:1.理解关联分析模型的原理。2.理解支持度和置信度的作用。教学内容及过程设计时间分配一、关联分析简介(20分钟)1.引例2.相关概念(1)支持度(2)置信度二、关联分析应用任务:新建“关联分析.str”数据流,导入“购物篮.txt”(见本书配套资源),利用Apriori(30分钟)模型对商品做关联分析,分析销售商品组合。【步骤1】~【步骤20】任务实训新建“关联分析.str”数据流,导入“购物篮.txt”,随机抽取其10%的数据,利用Apriori(30分钟)模型对商品做关联分析,并分析合理的销售商品组合。课后总结分析: