预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共37页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第五章主成分分析什么是主成分分析在综合评价工业企业的经济效益中,考核指标有: 1每百元固定资产原值实现产值、 2每百元固定资产原值实现利税、 3每百元资金实现利税、 4每百元工业总产值实现利税、 5每百元销售收入实现利税、 6每吨标准煤实现工业产值、 7每千瓦电力实现工业产值、 8全员劳动生产率、 9每百元流动资金实现的产值 指标间信息有重叠,指标数量又多。 经过主成分分析计算,最后确定选择了2个主成分作为综合评价工业企业经济效益的依据,变量数由9个减少到2个,这两个主成分代表的信息达91.6%,使所研究的问题简化。第一节主成分分析的几何意义X1 一般情况下,例如有n个样品,每个样品有两个变量值X1和X2,这n个样品的散点图如带状.θ 主成分分析通常的做法是,寻求原指标的线性组合Yi。主成分的求解: 主成分变量的标准化: 由于主成分是根据变量的离散度也即方差的大小来确定主成分的,这样当不同指标的量纲不同时,不同指标的方差大小差別很大,主成分会受到影响, 例如: X1表年收入,从万元到百万元变化, X2表净收入与总资产之比,从0.01到0.60变化, 那么X1的方差的绝对量将远远大于X2的方差, 这样主成分会过于照顾方差大的变量,为使主成分能均等地对待每一个原变量,应将原变量作标准化处理.标准化公式: (i=1,2,…P) 这时有= 因此求U时可用的特征向量。 还可以证明= 所以== 在实际问题中,利用主成分的目的是为了减少变量的个数,所以一般不用P个主成分,而是根据如下方法选取前K个主成分。 定义 为第i主成分Yi的方差贡献率。 这个值越大,说明这个主成分Yi综合原指标信息的能力越强。定义 (K≤P) 为主成分Yl,Y2,…,Yk的累积方差贡献率。 当前K个主成分的累积方差贡献率达到85%以上时,就取K个主成分。这样K个主成分基本反映了原指标的信息,指标数目由P个减少到K个。 (i=1,2,…P) 对于标准化后的变量,则主成分得分: 当选取了n个主成分后,把样本数据代入各主成分表达式可得样本的主成分得分。 若主成分是由原始数据协方差阵计算的,则计算主成分得分时,用原始数据。 若主成分是由标准化数据计算,即由R计算,则计算主成分得分时,一定要用标准化数据,否则会出现错误。主成分的综合得分 利用主成分Yl,Y2,…,Yk作线性组合,并以每个主成分Yi的方差贡献率作为权数构造一个综合函数: Y= 根据计算出的Y值大小进行排序。主成分的计算步骤:例一应收账款是指企业因对外销售产品、材料、提供劳务及其它原因,应向购货单位或接受劳务的单位收取的款项。出于扩大销售的竞争需要,企业不得不以赊销或其它优惠的方式招揽顾客,由于销售和收款的时间差,于是产生了应收款项。 应收款赊销的效果的好坏,不仅依赖于企业的信用政策,还依赖于顾客的信用程度。由此,评价顾客的信用等级,了解顾客的综合信用程度,对加强企业的应收账款管理大有帮助。某企业为了了解其客户的信用程度,采用西方银行信用评估常用的5C方法,5C的目的是说明顾客违约的可能性。1、品格(用X1表示),指顾客的信誉,履行偿还义务的可能性。企业可以通过过去的付款记录得到此项。 2、能力(用X2表示),指顾客的偿还能力。即其流动资产的数量和质量以及流动负载的比率。顾客的流动资产越多,其转化为现金支付款项的能力越强。同时,还应注意顾客流动资产的质量,看其是否会出现存货过多过时质量下降,影响其变现能力和支付能力。 3、资本(用X3表示),指顾客的财务势力和财务状况,表明顾客可能偿还债务的背景。 4、附带的担保品(用X4表示),指借款人以容易出售的资产做抵押。 5、环境条件(用X5表示),指企业的外部因素,即指非企业本身能控制或操纵的因素。首先抽取了10家具有可比性的同类企业作为样本,又请8位专家分别给10个企业的5个指标打分,然后分别计算企业5个指标的平均值,如表。第一主成份的贡献率为84.6%,第一主成份 Z1=0.469X1+0.485X2+0.473X3+0.462X4+0.329X5 的各项系数大致相等,且均为正数,是对所有指标的一个综合测度,可以作为综合的信用等级指标。可以用来排序。计算各企业的得分,并按分值大小排序:例对全国30个省市自汉区经济发展基本情况的八项指标作主成分分析,原始数据如下: 第一步将原始数据标准化。 第二步建立指标之间的相关数阵R如下:第三步求R的特征值和特征向量。从上表看,前3个特征值计累计贡献率已达89.564%,说明前3个主成分基本包含了全部指标具有的信息,我们取前3个特征值,并计算出相应的特征向量:因而前三个主成分为: 第一主成分: F1=0.456708X1+0.312729X2+0.470641X3+0.240481X4+0.250802X5 -0.2