预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共55页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

在科学研究中,往往希望尽可能多地收集反映研究对象的多个变量,以期能对问题有比较全面、完整的把握与认识。多变量的大样本虽然能为科学研究提供大量的信息,但是在一定程度上增加了数据采集的工作量,更重要的是在大多数情况下,许多变量之间可能存在相关性,这意味着表面上看来彼此不同的变量并不能从各个侧面反映事物的不同属性,而恰恰是事物同一种属性的不同表现。如何从众多相关的指标中找出少数几个综合性指标来反映原来指标所包含的主要信息,这就需要进行因子分析(FactorAnalysis),它是用少数几个因子来描述许多指标或因素之间的联系,即:用较少几个因子反映原始数据的大部分信息的统计方法。在SPSS系统里,实现因子分析的功能是在DataReduction命令菜单中。统计学原理因子分析的含义 寻找基本结构数据化简数学模型因子分析把每个原始变量分解成两部分:一部分是由所有变量共同具有的少数几个因子所构成的,即所谓公共因素部分;另一部分是每个变量独自具有的因素,即所谓独特因子部分。其中叫做公共因子,它们是在各个变量中共同出现的因子。我们可以把它们看作多维空间分布中互相垂直的个坐标轴。表示影响的独特因子,指原有变量不能被因子变量所解释的部分,相当于回归分析中的残差部分。叫做因子负荷(载荷),它是第个变量在第个主因子上的负荷或叫做第个变量在在第个主因子上的权值,它反映了第个变量在第个主因子上的相对重要性。 主成分分析:通过对一组变量的几个线性组合来解释这组变量的方差和协方差结构,以达到数据的压缩和数据的解释的目的。主成分分析的数学模型主成分分析与因子分析的公式上的区别因子分析的基本步骤(1)计算相关系数矩阵(2)进行统计检验2.KMO(Kaiser-Meyer-Olkin)检验。KMO统计量用于检验变量间的偏相关性是否足够小,是简单相关量和偏相关量的一个相对指数,由下式求得: 偏相关系数r12.3,r13.2,r23.1又称为一级偏相关系数二级偏相关系数:若有四个要素x1、x2、x3和x4,则有六个偏相关系数,即r12.34,r13.24,r14.23,r23.14,r24.13,r34.12,称为二级偏相关系数,计算公式如下:2.提取因子(1)特征值 特征值是指每个变量在某一公共因子上的因子负荷的平方总和,又叫特征根。在因子分析的公共因子提取中,特征值最大的公共因子会最先被提取,最后提取特征值最小的公共因子。因子分析的目的就是使因子维度简单化,希望以最小的公共因子能对总变异量作最大的解释,因而提取的因素愈少愈好,而提取因子之累积解释的变异量则愈大愈好。每个公共因子对原始数据的解释能力,可以用该因子所解释的总方差来衡量,通常称为该因子的贡献率,它等于和该因子有关的因子负荷的平方和,实际中常用相对指标来表示。相对指标体现公共因子的相对重要性,即每个公共因子所解释的方差占所有变量总方差的比例。3.决定旋转方法4.因子的命名5.计算因子得分因子分析的对话框介绍“Analyze”指定提取因子的依据: Correlationmatrix:相关系数矩阵(系统默认,当原有变量存在数量级的差异时,通常选择该选项) Covariancematrix:协方差矩阵Rotation按钮FactorScores按钮Option按钮案例分析操作步骤3637结果分析巴特利球形检验统计量为131.051,相应的概率Sig为0.000,因此可认为相关系数矩阵与单位阵有显著差异。同时,KMO值为0.762,根据Kaiser给出的KMO度量标准可知原有变量适合作因子分析。右表是因子分析的初始解,显示了所有变量的共同方差数据。“Initial”列是因子分析初始解下的变量共同方差。它表示,对原有9个变量如果采用主成分分析方法提取所有特征值(9个),那么原有变量的所有方差都可被解释,变量的共同方差均为1(原有变量标准化后的方差为1)。“Extraction”列是在按指定提取条件(本例提取3个因子)提取特征值时的共同方差。可以看到,所有变量的共同方差均较高,各个变量的信息丢失都较少。因此本次因子分析提取的总体效果较理想上表中,第一列是因子编号,以后三列组成一组,每组中数据项的含义依次是特征根值,方差贡献率和累计方差贡献率。 右图中,横坐标为因子数目,纵坐标为特征值。可见,第1个因子的特征值很高,对解释原有变量的贡献最大;第4个以后的因子特征值都较小,对解释原有变量的贡献很小,已经成为可被忽略的“高山脚下的碎石”,因此提取3个因子是适合的。从表中可以看到,9个变量在第1个因子上的负荷都很高,意味着它们与第1个因子的相关程度高,其余2个因子与9个变量的相关性相对较小。另外还可看到,这3个因子的实际含义比较模糊。从右表可知,用主成分分析法进行方差极大法旋转后,在校生数、招生数、毕业生数、专