预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10
亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
题目基于聚类分析的我国各地GDP及影响因素分析学生姓名陈煌学号1109014042所在学院数学与计算机科学学院专业班级数学与应用数学专业2011级数应1班指导教师李晓康基于聚类分析的我国各地GDP及影响因素分析陈煌(陕西理工学院数学与计算机科学学院数学与应用数学1101班陕西汉中723001)指导教师:李晓康[摘要]:利用SPSS软件对全国30个省、直辖市、自治区的主要经济指标进行聚类分析将其经济分成按照不同的分析方法可分为不同的几种类型.通过这种方法对全国各省进行经济分类.本文选取了7项经济指标作为决定经济类型的影响因素各项数据均来自2010年国家统计年鉴.分析结果表明:北京市和上海市稳居第一类经济类型;江苏省和、山东省、广东省和浙江多数处于第四类经济;其他25个省、直辖市、自治区基本在第二类型与第三类型变化.[关键词]:SPSS软件;聚类分析;经济类型;GDP引言在当今欧美主导的经济发展理论下衡量一个国家的综合实力看的不仅是国家的军事实力、国家影响力而更看重国家的经济实力而GDP代表一国或一个地区所有常住单位和个人在一定时期内全部生产活动的最终成果是当期新创造财富的价值总量它是一个国家经济实力的最好体现具有国际可比性是联合国国民经济核算体系(SNA)中最重要的总量指标为世界各国广泛使用并用于国际比较.众所周知2008年我国GDP跃居世界第三位是仅次于美国、日本的第三大经济国而2009年在金融危机的影响下我国GDP稳中求进依然保持着9.0%的增长态势.提高GDP已经成为经济发展的潮流利用国家的各种有限资源在最大程度上发挥资源的利用率推动经济的发展是势在必行的因为资源一直在减少而人口一直在增加要保持经济的增长就必要抓住主要因素提高GDP.但是如果研究我国整体的GDP的意义就不大了所以我选择了对中国各地的GDP进行研究.为了我国能够均衡发展.2.预备知识2.1聚类分析的概述聚类分析是研究(样品或变量)分析问题的一种多元统计方法所谓类通俗地说就是指相似元素的集合.严格的数学定义是较麻烦的在不同问题中类的定义是不同的.为了将样品(或变量)进行分类就需要研究样品之间的关系.目前用得最多的方法有两个:一种方法是用相似系数性质越接近的样品.另一种方法是将一个样品看作p维空间的一个点并在空间定义距离距离越近的点归为一类距离越远的点归为不同的类.聚类通过把目标数据放入少数相对同源的组或“类”(cluster)里.分析表达数据(1)通过一系列的检测将待测的一组基因的变异标准化然后成对比较线性协方差.(2)通过把用最紧密关联的谱来放基因进行样本聚类例如用简单的层级聚类(hierarchicalclustering)方法.这种聚类亦可扩展到每个实验样本利用一组基因总的线性相关进行聚类.(3)多维等级分析(multidimensionalscalinganalysisMDS)是一种在二维Euclidean“距离”中显示实验样本相关的大约程度.(4)K-means方法聚类通过重复再分配类成员来使“类”内分散度最小化的方法.聚类方法有两个显著的局限:首先要聚类结果要明确就需分离度很好(well-separated)的数据.几乎所有现存的算法都是从互相区别的不重叠的类数据中产生同样的聚类.但是如果类是扩散且互相渗透那么每种算法的的结果将有点不同.结果每种算法界定的边界不清每种聚类算法得到各自的最适结果每个数据部分将产生单一的信息.为解释因不同算法使同样数据产生不同结果必须注意判断不同的方式.对遗传学家来说正确解释来自任一算法的聚类内容的实际结果是困难的(特别是边界).最终将需要经验可信度通过序列比较来指导聚类解释.第二个局限由线性相关产生.上述的所有聚类方法分析的仅是简单的一对一的关系.因为只是成对的线性比较大大减少发现表达类型关系的计算量但忽视了生物系统多因素和非线性的特点.从统计学的观点看聚类分析是通过数据建模简化数据的一种方法.传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚