预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共39页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

用SPSS作聚类分析SPSS中的聚类分析一、HierarchicalCluster聚类系统聚类的中要进行以下的选择: 数据的标准化 测度方法的选择:距离方法的选择或相似性、关联程度的选择。 聚类方法的选择:即以什么方法聚类,spss中提供了7中方法可进行选择。 输出图形的选择:树形图或冰柱图。 系统聚类Method(一)聚类方法 1.Between-groupslinkage类间平均法 两类距离为两类元素两两之间平均平方距离 2.Within-groupslinkage类内平均法 两类距离为合并后类中可能元素两两之间平均平方距离 3.Nearestneighbor最短距离法 4.Furthestneighbor最长距离法 5.Centroidclustering重心法(欧式距离) 6.Medianclustering中间距离法(欧式距离) 7.WardMethod离差平方法(欧式距离) 1.squaredeuclideandistance平方欧式距离 2.euclideandistance欧式距离 3.cosine夹角余弦(R型) 4.pearsoncorrelation皮尔逊相关系数(R) 5.chebychev切比雪夫距离6.block绝对值距离 7.minkowski明考斯基 8.customized毛本清 2010.08.27Statistics毛本清 2010.08.27凝聚状态表的第一列表示聚类分析的第几步;第二列、第三列表示本步聚类中哪两个样本或小类聚成一类;第四列是相应的样本距离或小类距离;第五列、第六列表明本步聚类中,参与聚类的是样本还是小类。0表示样本,数字n(非0)表示由第n步聚类产生的小类参与本步聚类;第七列表示本步聚类的结果将在下面聚类的第几步中用到。毛本清 2010.08.27PlotNumberofclusters冰柱图因其样子非常象冬天房顶垂下的冰柱得名,它以图形的方式显示层次聚类分析结果,一般从冰柱图的最后一行开始观察,第一列表示类数。两样品之间的“х”表示将其两边的样品(类)联结起来聚成新类。毛本清 2010.08.27应用举例:首先对表4-1中的原始数据进行标准化变换处理,经过运算使数据标准化得到表4-2,使它的每列数据的平均值为0,方差为1,这样表4-1中5列具有不同量纲、不同数量级的数据毛本清 2010.08.27毛本清 2010.08.27表4-1毛本清 2010.08.27表4-2毛本清 2010.08.27毛本清 2010.08.27K-MeansCluster聚类K-MeansCluster原理K-MeansCluster聚类过程例饮料数据(spssex/drink.sav)快速聚类选项快速聚类法的聚类数由用户指定,分类是唯一的。 1.分类数:如希望聚成K类 2.聚类方法:method:iterateandclussify(聚类分析的 clussifyonly(聚类分析过程类中心 3.聚类中心:centers 4.迭代次数:iterate 5.保存分类结果:saveInitialClusterCenter:快速聚类的初始类中心点(本例由系统自行指定四个类的初始类中心点)IterationHistory:快速聚类的迭代步骤 在迭代过程中,完成第一次迭代后形成的四个新类中心点距初始类中心点的欧氏距离分别为5.065、12.532、12.275、25.901。第四次迭代后形成的四个新类中心点几乎与上次确定的中心点没有差别。经过四次迭代,快速聚类完成。快速聚类的最终类中心点NumberofCasesin eachCluster:快速聚 类的最终结果