预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共15页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

SPSS软件之聚类分析和判别分析一、什么是聚类分析和判别分析?总体来说,聚类分析就是把没有分类信息的资料按照相似程度进行归类; 两类:系统聚类法和非系统聚类法,系统聚类法是应用最广泛的一种方法; 聚类分析的核心是确定“度量==分类的准则”;判别分析是判别样品所属类型的一种统计方法。与聚类分析一样,判别分析也用于解决分类问题的,不同之处在于,判别分析是在已知研究对象分成若干类型(或组别)并已经取得各种类型的一批已知样品的观测量数据的基础上,根据某些准则建立判别式,然后对未知类型的样品进行判别分析。 按照判别准则,分为:距离判别、Bayes判别和Fisher判别。在解决实际问题中,聚类分析和判别分析往往联合起来使用。二、聚类分析主要方法1.系统聚类法核心思想2.系统聚类法步骤(2)计算聚类统计量。聚类统计量是根据变换以后的数据计算得到的一个新数据。它用于表明各样品或变量间的关系密切程度和相似系数两大类。 (3)选择聚类方法。根据聚类统计量,运用一定的聚类方法,将关系密切的样品或变量聚为一类,将关系不密切的样品或变量加以区分。选择聚类方法是聚类分析最终的也是最重要的一步。案例1三、判别分析主要方法Fisher判别法:借助方差分析的思想构造一个判别函数,其中判别系数的确定原则是使得类间的区别最大,而且类内的离差最小,利用判别函数计算出待判样品的判别指标,然后与判别临界值进行比较,判别它的类属。 应用较广,对分布方差都没有要求,但总体个数多时,麻烦。Bayes判别法:在考虑先验概率的前提下,利用Bayes公式计算样品来自第I类的后验概率,使用错判损失最小的概念作为判别准则,建立判别函数,将待判样品归入来自概率最大的类。 Bayes判别主要用于多类判别,要求总体呈多元正态分布;逐步判别法:与逐步回归法思想类似,都是逐步引入变量,每引入一个“最重要”的变量进入判别式,同时也考虑较早引入判别式的某些变量,若其判别能力不显著了,就剔除,知道判别式中没有不重要的变量需要剔除,且没有重要的变量需要引入为止。这个筛选过称的本质就是假设检验。案例2