预览加载中,请您耐心等待几秒...
1/6
2/6
3/6
4/6
5/6
6/6

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第39卷第18期数学的实践与认识Vol.39No.18 2009年9月MATHEMATICSINPRACTICEANDTHEORYSep.,2009 基于主成分分析法的综合评价方法的改进 孙刘平1,钱吴永2 (1.常州纺织服装职业技术学院数学教研室,江苏常州213164) (2.南京航空航天大学经济与管理学院,江苏南京210016) 摘要:针对用主成分分析法做综合评价存在的问题,提出了改进的方法即当第一主成分的综合评价值和 熵值法得到的综合评价值具有一致性时,将两种评价结果进行集成综合评价,若两种评价结果不具有一致性 时则采用主成分聚类法进行综合评价. 关键词:主成分分析;熵值法;综合评价 0引言 主成分分析法被大量应用于社会学、经济学、管理学的评价中,逐步成为了独具特色的 多指标评价技术.但在实际应用中也出现了这样或那样的问题,许多研究者对这些问题作了 相应的研究,许多研究者从不同角度分析找出问题存在的原因并给出相应的改进办法.如陈 述云、张崇甫[1]认为主成分分析在应用过程中主要存在两个问题:究竟选取多少个主成分进 行评优排序;有时难以对主成分作出合乎客观的经济解释,这有碍与对定量综合评价作出定 性分析.他们认为产生问题的原因在于主成分分析所采用的线性分析造成的,并给出了非线 性主成分分析的方法,并设想通过对主成分进行旋转以明确主成分的经济含义.白雪梅、赵 松山[2]则从主成分分析与因子分析区别的角度分析了主成分分析作综合评价所存在的问 题,并指出数据无量纲化处理方法及特征向量的选取是对主成分析做综合评价造成的影响 原因,并给出了解决的方法.阎慈琳[3]则认为用主成分分析作综合评价的问题在于同一个特 征值对应两个方向相反的特征向量,而选不同的特征向量组合可能造成综合评价结果大不 相同,作者认为应采用第一主成分进行评价或对主成分进行旋转.叶双峰[4]从改进主成分分 析的数据无量纲化处理方法和采用非线性变换的主成分分析来做的综合评价.傅荣林[5]对 主成分的选取及评价模型的限制条件作了分析并给出主成分评价优化模型.以上研究的均 未解决在第一主成分的贡献率没有达到要求时,不能只选用第一主成分进行评优排序,而选 用多个主成分进行综合评价时,除第一主成分外的其他主成分的系数符号的选取问题.本文 基于以上研究和分析提出用主成分分析做综合评价时选取第一主成分的得分值作为综合得 分值,并将第一主成分表达式中系数较小的指标筛选出来,也就是将对第一主成分没有显著 贡献的指标筛选出来,然后采用熵值法得综合得分值.最后将由第一主成分得到的综合得分 值和利用熵值法得到的综合评价结果,进行一致性检验通过一致性检验就将两种评价结果 进行集成评价.如果两种评价方法不具有一致性,则采用主成分聚类法进行评价. 收稿日期:2009-01-06 16数学的实践与认识39卷 1主成分分析法 1.1主成分分析法的基本思想及数学原理 主成分分析就是设法将原来指标重新组合成一组新的互相无关的几个综合指标来代替 原来指标.同时根据实际需要从中可取几个较少的综合指标尽可能多地反映原来的指标的 信息. 设有n个样本,每个样本共有p个变量,构成一个n×p阶的样本数据矩阵 x11x12⋯x1p x21x22⋯x2p X=  xn1xn2⋯xnp 记X的第i个列向量为Xi(i=1,2,⋯,p),数据矩阵X的p个向量(即p个指标向量)X1, X2,⋯,Xp作线性组合(即综合指标向量)为: Fi=a1iX1+a2iX2+⋯+apiXp,i=1,2,⋯,p TT 记ai=(a1i,a2i,⋯,api),为了加以限制则要求组合系数aiõai=1,i=1,2,⋯,p,即ai为 单位向量且由下列原则确定: 1)Fi,Fj(i≠j,i=1,2,⋯,p)不相关,即cov(Fi,Fj)=0. 2)F1是X1,X2,⋯,Xp的一切线性组合(系数满足上述要求)中方差最大的,则称F1是 第一主成分.F2是与F1不相关的X1,X2,⋯,Xp的一切线性组合中方差最大的,F2为第二 主成分,次类推可定义出p个主成分. 这p个主成分从原始指标所提供的信息总量中所提取的信息量依次递减,每一个主成 分所提取的信息量用方差来度量,且主成分方差的贡献就等于原指标相关矩阵相应的特征 p 值Ki,每一个组合系数ai就是特征值Ki的特征向量,Fi的方差贡献率为Ki/∑Ki,方差贡献 i=1 率越大说明相应的主成分反映综合信息的能力越强. 1.2改进的主成分分析法 根据叶双峰的研究[4]采用数据标准化处理会造成指标信息的丢失,并采用数据均值化 xij 方法进行主成分分析.所谓均值法就是用数据的均值去除原始数据,即yij=,其中xj= xj n 1 ∑xij,j=1,2,⋯,p.这样对原