预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

主成分分析法 主成分分析(principalcomponentsanalysis,PCA)又称:主分量分析,主成分回归分析法 什么是主成分分析法 主成分分析也称主分量分析,旨在利用降维的思想,把多HYPERLINK"http://wiki.mbalib.com/wiki/%E6%8C%87%E6%A0%87"\o"指标"指标转化为少数几个综合指标。 在HYPERLINK"http://wiki.mbalib.com/wiki/%E7%BB%9F%E8%AE%A1%E5%AD%A6"\o"统计学"统计学中,主成分分析(principalcomponentsanalysis,PCA)是一种简化数据集的技术。它是一个线性变换。这个变换把数据变换到一个新的坐标系统中,使得任何数据投影的第一大HYPERLINK"http://wiki.mbalib.com/wiki/%E6%96%B9%E5%B7%AE"\o"方差"方差在第一个坐标(称为第一主成分)上,第二大方差在第二个坐标(第二主成分)上,依次类推。主成分分析经常用减少数据集的维数,同时保持数据集的对HYPERLINK"http://wiki.mbalib.com/wiki/%E6%96%B9%E5%B7%AE"\o"方差"方差贡献最大的特征。这是通过保留低阶主成分,忽略高阶主成分做到的。这样低阶成分往往能够保留住数据的最重要方面。但是,这也不是一定的,要视具体应用而定。 主成分分析的基本思想 在实证问题研究中,为了全面、系统地分析问题,我们必须考虑众多影响因素。这些涉及的因素一般称为指标,在多元统计分析中也称为HYPERLINK"http://wiki.mbalib.com/wiki/%E5%8F%98%E9%87%8F"\o"变量"变量。因为每个变量都在不同程度上反映了所研究问题的某些信息,并且指标之间彼此有一定的相关性,因而所得的HYPERLINK"http://wiki.mbalib.com/wiki/%E7%BB%9F%E8%AE%A1%E6%95%B0%E6%8D%AE"\o"统计数据"统计数据反映的信息在一定程度上有重叠。在用HYPERLINK"http://wiki.mbalib.com/wiki/%E7%BB%9F%E8%AE%A1%E6%96%B9%E6%B3%95"\o"统计方法"统计方法研究多变量问题时,变量太多会增加计算量和增加分析问题的复杂性,人们希望在进行HYPERLINK"http://wiki.mbalib.com/wiki/%E5%AE%9A%E9%87%8F%E5%88%86%E6%9E%90"\o"定量分析"定量分析的过程中,涉及的变量较少,得到的HYPERLINK"http://wiki.mbalib.com/wiki/%E4%BF%A1%E6%81%AF%E9%87%8F"\o"信息量"信息量较多。主成分分析正是适应这一要求产生的,是解决这类题的理想工具。 同样,在科普效果评估的过程中也存在着这样的问题。科普效果是很难具体量化的。在实际评估工作中,我们常常会选用几个有代表性的综合指标,采用打分的方法来进行评估,故综合指标的选取是个重点和难点。如上所述,主成分分析法正是解决这一问题的理想工具。因为评估所涉及的众多变量之间既然有一定的相关性,就必然存在着起支配作用的因素。根据这一点,通过对原始变量相关HYPERLINK"http://wiki.mbalib.com/wiki/%E7%9F%A9%E9%98%B5"\o"矩阵"矩阵内部结构的关系研究,找出影响科普效果某一要素的几个综合指标,使综合指标为原来变量的线性拟合。这样,综合指标不仅保留了原始变量的主要信息,且彼此间不相关,又比原始变量具有某些更优越的性质,就使我们在研究复杂的科普效果评估问题时,容易抓住主要矛盾。上述想法可进一步概述为:设某科普效果评估要素涉及个指标,这指标构成的维随机向量为。对作正交变换,令,其中为正交阵,的各分量是不相关的,使得的各分量在某个评估要素中的作用容易解释,这就使得我们有可能从主分量中选择主要成分,削除对这一要素影响微弱的部分,通过对主分量的重点分析,达到对原始变量进行分析的目的。的各分量是原始变量线性组合,不同的分量表示原始变量之间不同的影响关系。由于这些基本关系很可能与特定的作用过程相联系,主成分分析使我们能从错综复杂的科普评估要素的众多指标中,找出一些主要成分,以便有效地利用大量统计数据,进行科普效果评估分析,使我们在研究科普效果评估问题中,可能得到深层次的一些启发,把科普效果评估研究引向深入。 例如,在对科普产品开发和利用这一要素的评估中,涉及科普创作人数百万人、科普作品发行量百万人、科普产业