预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

§.利用和实现主成分分析 .直接调用软件实现 在软件中实现主成分分析可以采取两种方式实现:一是通过编程来实现;二是直接调用中自带程序实现。 通过直接调用中的程序可以实现主成分分析: 式中:为输入数据矩阵 (一般要求>) 输出变量: ①主分量的系数,也叫因子系数;注意:单位阵 ②是主分量下的得分值;得分矩阵与数据矩阵的阶数是一致的; ③是对应列的方差向量,即的特征值;容易计算方差所占的百分比 *(); ④表示检验的统计量(方差分析要用) 计算过程中应用到计算模型: (要求<) 例:表为某地区农业生态经济系统各区域单元相关指标数据,运用主成分分析方法可以用更少的指标信息较为精确地描述该地区农业生态经济的发展状况。 表某农业生态经济系统各区域单元的有关数据 样本序号:人口密度(人):人均耕地面积():森林覆盖率():农民人均纯收入(元人):人均粮食产量(人):经济作物占农作物播面比例(%):耕地占土地面积比率(%):果园与林地面积之比(%):灌溉田占耕地面积之比(%) 对于上述例子,进行主成分分析,可以得到如下结果。 以及每一个主成分的贡献率和累计贡献率,如表和图。 表.特征根及主成分贡献率 主成分 特征值 贡献率% 累积贡献率% 图特征根 前几个主成分的载荷系数如表所示。 表前三个主成分在原变量上的载荷 前三个主成分 变量.直接调用软件实现 多元分析处理的是多指标的问题。由于指标太多,使得分析的复杂性增加。观察指标的增加本来是为了使研究过程趋于完整,但反过来说,为使研究结果清晰明了而一味增加观察指标又让人陷入混乱不清。由于在实际工作中,指标间经常具备一定的相关性,故人们希望用较少的指标代替原来较多的指标,但依然能反映原有的全部信息,于是就产生了主成分分析、对应分析、典型相关分析和因子分析等方法。 调用菜单的过程命令项,可对多指标或多因素资料进行因子分析。因子分析的基本目的就是用少数几个因子去描述许多指标或因素之间的联系,即将相关比较密切的几个变量归在同一类中,每一类变量就成为一个因子(之所以称其为因子,是因为它是不可观测的,即不是具体的变量,这与上一章的聚类分析不同),以较少的几个因子反映原资料的大部分信息。 基本操作 以以上例子来说明在中进行因子分析的整个过程。 将以上数据导入到数据窗口中,先定义各变量为型。 ①激活菜单选的...命令项,弹出对话框(图)。在对话框左侧的变量列表中选变量至,点击Ø钮使之进入框。 图因子分析对话框 点击...钮,弹出对话框(图),在中选项要求输出各变量的均数与标准差,在栏内选项要求计算相关系数矩阵,并选’项,要求对相关系数矩阵进行统计学检验。点击钮返回对话框。 图描述性指标选择对话框 点击...钮,弹出对话框(图),系统提供如下因子提取方法: 图因子提取方法选择对话框 :主成分分析法; :未加权最小平方法; :综合最小平方法; :极大似然估计法; :主轴因子法; :α因子法; :多元回归法。 本例选用方法,之后点击钮返回对话框。 点击...钮,弹出对话框,系统有种因子旋转方法可选: :不作因子旋转; :正交旋转; :全体旋转,对变量和因子均作旋转; :四分旋转,对变量作旋转; :斜交旋转。 旋转的目的是为了获得简单结构,以帮助我们解释因子。本例选正交旋转法,之后点击钮返回对话框。 点击...钮,弹出弹出对话框,系统提供种估计因子得分系数的方法,本例选(回归因子得分),之后点击钮返回对话框,再点击钮即完成分析。 结果解释 在输出结果窗口中将看到如下统计数据: 系统首先输出各变量的均数()与标准差(),并显示共有例观察单位进入分析;接着输出相关系数矩阵(),经检验表明:值,<,即相关矩阵不是一个单位矩阵,故考虑进行因子分析。 :人口密度(人) :人均耕地面积() :森林覆盖率() :农民人均纯收入 (元人) :人均粮食产量 (人) :经济作物占农作 物播面比例(%) :耕地占土地面积 比率(%) :果园与林地面积 之比(%) :灌溉田占耕地面 积之比(%) . 人口密度人均耕地面积森林覆盖率农民人均纯收入人均粮食产量经济作物占农作物播面比例耕地占土地面积比率果园与林地面积之比灌溉田占耕地面积之比人口密度人均耕地面积森林覆盖率农民人均纯收入人均粮食产量经济作物占农作物播面比例耕地占土地面积比率果园与林地面积之比灌溉田占耕地面积之比 使用主成分分析法得到个因子,因子矩阵()如下,变量与某一因子的联系系数绝对值越大,则该因子与变量关系越近。如本例变量与第一因子的值为,与第二因子的值为,可见其与第一因子更近,与第二因子更远。或者因子矩阵也可以作为因子贡献大小的度量,其绝对值越大,贡献也越大。 :.