预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共33页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

主成分分析 (PrincipalComponentsAnalysis) 是由Hotelling于1933年首先提出的, 它是利用降维的思想,把多指标转化 为少数几个综合指标的多元统计分析 方法。 从数学角度来看,这是一种降维处理 技术。主成分分析的目的与功能主成分的主要功能一、主成分分析的基本原理当m较大时,在m维空间中考察问题比较麻烦。为了克服这一困难,就需要进行降维处理,即用较少的几个综合指标代替原来较多的变量指标,而且使这些较少的综合指标既能尽量多地反映原来较多变量指标所反映的信息,同时它们之间又是彼此独立的。定义:记x1,x2,…,xm为原变量指标,F1,F2,…,Fp(p≤m)为新变量指标 ②F1是x1,x2,…,xm的一切线性组合中方差最大者,F2是与F1不相关的x1,x2,…,xm的所有线性组合中方差最大者; …… Fp是与F1,F2,……,Fp-1都不相关的x1,x2,…xm,的所有线性组合中方差最大者。 则新变量指标F1,F2,…,Fp分别称为原变量指标x1,x2,…,xm的第一,第二,…,第p主成分。 从以上的分析可以看出,主成分分析的实质就是确定原来变量xj(j=1,2,…,m)在诸主成分Fi(i=1,2,…,p)上的权重eij(i=1,2,…,p;j=1,2,…,m)。 从数学上容易知道,从数学上可以证明,它们分别是的相关系数矩阵的p个较大的特征值所对应的单位化特征向量。二、计算步骤(二)计算特征值与特征向量: ①解特征方程,常用雅可比法(Jacobi)求出特征值,并使其按大小顺序排列;③计算主成分贡献率及累计贡献率 ▲贡献率:(三)确定主成分(四)排序问题:三、主成分分析实例1Matlab程序Matlab程序主成分分析实例2利用Matlab求解贡献率为是反映学生身材魁梧与否的综合指标 是反映学生体形特征的综合指标。表1是某市工业部门13个行业的8项重要经济指标的数据,这8项经济指标分别是: X1:年末固定资产净值,单位:万元; X2:职工人数据,单位:人; X3:工业总产值,单位:万元; X4:全员劳动生产率,单位:元/人年; X5:百元固定资产原值实现产值,单位:元; X6:资金利税率,单位:%; X7:标准燃料消费量,单位:吨; X8:能源利用效果,单位:万元/吨。表1某市工业部门13个行业8项指标我们要考虑的是:如何从这些经济指标出发,对八个指标进行适当的缩减,便于我们对某市经济状态做定性分析?0.002442表2特征根和累计贡献率表3特征向量 表4各行业主成分得分及排序从上表可以看出,机器行业在该地区的综合评价排在第一,原始数据也反映出机器行业存在明显的规模优势, 另外从前两个主成分得分上看,该行业也排在第一位,同样存在效益优势;而排在最后三位的分别是皮革行业、电力行业和煤炭行业。