预览加载中,请您耐心等待几秒...
1/4
2/4
3/4
4/4

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

万方数据 主成分分析与因子分析关系探讨及软件实现主成分分析与因-T-fr’#itl,23O弓I畜Yi--u㈣X+11Ⅸ一⋯+u≯P.i=l,2,⋯,p【~⋯~J别、德山件方差可以任意大,于是有下面的约束条件:uil2-blli22+⋯+u占矩阵∑的特征值一特征向量对为(入⋯U),⋯,供,up),其中入-≥的变量均用X表示,F1,Fz,⋯,蹦m<p),表示标准化后的公共因为对角矩阵∑。=diag(tru2,cr222,⋯,叮0,即8的各分量之间也是其中,A=l;’.il,F为公共因子.A为因子载荷矩阵,e(辽宁师范大学数学学院,辽宁大连1要:文章论述了主成分分析与因子分析之间的区别与联系.同时指出SPSS软件实现主成分分析的错误之处,并给出其正确的实现方法。另外,针对文献【4,51中提出的因子分析模型精确解加以探讨,指出其精确解实际上就是主成分解,并以具体实例加以说明。关键词:主成分分析;因子分析;特征值;特征向量;栽荷矩阵文章编号:1002—6487(2008)13-0153.03实际中所研究的问题经常涉及多个指标变量.由于变量个数太多,并且彼此之问存在一定的相关性.使得数据存在着一定的信息重叠。于是人们希望能用较少的综合变量来代替原来信息冗余的较多的变量,且这几个综合变量又能充分反映原来变量的信息。且彼此之间不相关。主成分分析就是将多个指标化为少数几个综合指标的统计方法。因子分析是主成分分析的推广.因子分析的目的是用几个潜在的随机量去描述多变量间的协方差关系,这些随机量叫做因子。因子分析与主成分分析存在密切的联系,但也有显著的区别。目前已经有很多软件能够实现主成分分析和因子分析,其中最常用的是SPSS和SAS。SPSS并没有单独实现主成分分析的功能模块.而是将其嵌入在因子分析模块中。这也使得在应用时容易造成二者之间的混淆。本文将阐述它们之间的区别与联系,从而揭示二者之间的易混淆之处.并给出其正确的软件实现方法。另外,本文将针对文献【4,5】中的因子分析模型精确解展开一些讨论。设研究对象涉及P个指标,分别用X。,X2,⋯,X。表示,这P个指标构成的P维随机向量为x=(x。,X2,⋯,Xp)7。设随机向量X的均值为斗,协方差矩阵为∑。主成分分析就是对X进行线性变换以形成新的综合变量.用Y表示,即满足下式:(1)为了使新的综合变量能够充分反映原来变量的信息.希望Y;的方差尽可能大且各Y;之间不相关。由于没有限制条l(i=l,2,⋯,p)。满足条件的Y.被称为第i个主成分。理沦推导可知主成分可以由协方差矩阵求出。设协方差入2≥⋯≥入。I>0,则第i个主成分为Y;-----11.Ⅸ.于是有var(YJ=k。一般选取累计贡献率达到85%以上的前几个主成分作为研究的指标。主成分的选取也要考虑其解释能力。当协方差矩阵未知时,一般南样本协方差矩阵来代替。主成分也可以由相关矩阵求出.但其结果有时与协方差矩阵求出的结果是不同的。一般为了消除量纲的影响经常由相关矩阵求主成分。当数据被标准化处理后,协方差矩阵和1.2因子分析主成分分析是将原始变星综合成若干个主成分变量来表示,而因子分析是将原始变量用若干个公共的因子变量来表示。因子分析有R型因子分析和Q型因子分析,这里我们只讨论R型因子分析。为了方便这里把原始变量及标准化后子。构造因子分析模型需要以下条件满足:(1)X=()(1,x2,⋯,xp)7是可观测随机向量,E(X)---0,COV()【)=∑,这里将X看作是标准化变量。所以协方差矩阵∑与相关矩阵R相等。(2)F=伊I,F2,⋯,FJ7(m<p)是不可观测的变量.E(D--0,cov(D:I,即F的各分量是互不相关。(3)e=(8I,82’⋯,8p)7与F互不相关,且E(e)--0,协方差矩阵因子分析模型为Xi=allFl+a垃F’一⋯+ah。F:一£i,i=l,2,⋯,p(2)模型(21写成矩阵形式为:.(3)■⋯a“1为特殊因子。由因子分析假设易知COv()【。D=aii,由于都是标准化变量,所以%也是二者的相关系数。称hi2=ail2+⋯+a淑i-l,2,⋯,16029)摘中图分类号:021文献标识码:A1.1主成分分析相关矩阵是相同的。互不相关的。1X=AF+8统计与决策2008年第13期(总第265期)153。 万方数据 、/丽。factor2乘上、/丽就能得到主成分得分。这个计(。l-u+。入。。I/2⋯,叭';z。称为随机误差因子,80皇(f0Ix。。。巴⋯,主成分分析的SPSS软件实现4因子分析模型的软件实现维因子,Z?鲁(fl入。一112,⋯工k',B。为误差因子载荷矩阵,B粤2主成分分析与因--子J'Y@T的区别与联系越好。另外gj2=a-j2+⋯+%20=1,2,---,m),为公共因子E对x所需将其标准化。于是令F