预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共72页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

复杂问题的简化与分组——聚类分析内容提要2.1聚类分析概述聚类分析概述聚类分析概述聚类分析数据格式聚类分析的变量类型聚类分析的应用聚类分析的类型聚类分析要注意的问题2.2相似性度量相似性度量一、相关测度一、相关测度一、相关测度二、距离测度(一)距离:样本间的亲疏关系1.绝对距离(block)2.欧氏(Euclidian)距离3.切比雪夫距离(Chebychev)4.明氏(Minkowski)距离明氏距离的缺点5.马氏(Mahalanobis)距离(二)距离测度三、关联测度(一)简单匹配系数SPSS距离测度方法选项2.3系统聚类法(HierarchicalClustering)系统聚类法聚集法与分割法图示类与类间的距离SPSS系统聚类方法选项SPSS系统聚类方法选项SPSS系统聚类方法选项系统聚类法的步骤【案例2.1】我国地区生活水平差异的聚类分析【案例2.1】我国地区生活水平差异的聚类分析【案例2.1】我国地区生活水平差异的聚类分析【案例2.1】我国地区生活水平差异的聚类分析表1:聚类过程表1:聚类过程表1:聚类过程表2聚类方案横轴表示各类别之间的相对距离大小。图2:树状图分类数的确定分类数的确定49【案例2.1】我国地区生活水平差异的聚类分析【案例2.1】我国地区生活水平差异的聚类分析【案例2.1】我国地区生活水平差异的聚类分析【案例2.1】我国地区生活水平差异的聚类分析2.4K-均值聚类法(K-Means)K-均值聚类法K-均值聚类法K-均值聚类法K-均值聚类法K-均值聚类法【案例2.2】移动电话客户通话情况的聚类分析【案例2.2】移动电话客户通话情况的聚类分析【案例2.2】移动电话客户通话情况的聚类分析表1:初始聚类中心第一类:总通话时间长、工作日上班通话时间长、国际通话时间长的“高端商用客户”,443人。2.5两步聚类法(TwoStepCluster)两步聚类法简介【案例2.3】汽车购买者的市场区隔聚类模型概要给出了各类别中各变量的主要分布特征:第一类是男性、军人、年龄平均为40岁;第二类是女性、公务员,年龄平均为25岁。 同此,该表给出了这些变量在聚类分析中的重要性。如果有的变量重要性比较低,可以考虑剔除这些变量。本章练习