预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共29页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第10章空间统计分析 统计分析是空间分析的主要手段,贯穿于空间分析的各个主要环节。空间统计分析方法不仅仅限于常规统计方法,还包括利用空间位置的空间自相关分析。本章主要介绍常用统计量、数据特征分析(即探索性数据分析)、分级统计分析、空间插值和空间回归分析五方面内容。 10.1概述 10.1.1基本概念 空间统计分析可包括“空间数据的统计分析”及“数据的空间统计分析”,前者着重于空间物体和现象的非空间特性的统计分析,解决的一个中心议题就是如何以数学统计模型来描述和模拟空间现象和过程,即将地理模型转换成数学统计模型,以便于定量描述和计算机处理,着重于常规的统计分析方法,尤其是多元统计分析方法对空间数据的处理,而空间数据所描述的事物的空间位置在这些分析中不起制约作用。如趋势面拟合被广泛应用于地理数据的趋势分析中,但在这种分析中,仅考虑了样本值的大小,而并不考虑这些样本在地理空间的分布特征及其相互间的位置关系。从这个意义上讲,空间数据的统计分析在很多方面,与一般的数据分析并无本质差别,但是对空间数据的统计分析结果的解释则必然要依托于地理空间进行,在很多情况下,分析的结果以地图方式来描述和表达的。因此,空间数据的统计分析尽管在分析过程中没有考虑数据抽样点的空间位置,但描述的仍然是空间过程,揭示的也是空间规律和空间机制。 数据的空间统计分析则是直接从空间物体的空间位置、联系等方面出发,研究既具有随机性又具有结构性,或具有空间相关性和依赖性的自然现象。凡是与空间数据的结构性和随机性,或空间相关性和依赖性,或空间格局与变异有关的研究,并对这些数据进行最优无偏内插估计,或模拟这些数据的离散性、波动性,都是数据的空间统计分析的研究内容。数据的空间统计分析不是抛弃了传统的统计学的理论和方法,它是在传统的统计学基础上发展起来的。数据的空间统计学与经典统计学的共同之处在于:它们都是在大量采样的基础上,通过对样本属性值的频率分布、均值、方差等关系及其相应规则的分析,确定其空间分布格局与相关关系。数据的空间统计学区别于经典统计学的最大特点是:数据的空间统计学既考虑到样本值的大小,又重视样本空间位置及样本间的距离。空间数据具有空间依赖性(空间自相关)和空间非均质性(空间结构),扭曲了经典统计方法的假设条件,使得经典统计模型对空间数据的分析会产生虚假的解释。经典统计学模型是在观测结果相互独立的假设基础上建立的,但实际上地理现象之间大都不具有独立性。数据的空间统计学研究的基础是空间对象间的相关性和非独立的观测,它们与距离有关,并随着距离的增加而变化。这些问题为经典的统计学所忽视,但却成为数据的空间统计学的核心。 10.1.2主要分析内容 空间统计分析与经典统计学的内容往往是交叉的。空间统计分析使用统计方法解释空间数据,分析数据在统计上是否是“典型”的,或“期望”的。同时,它又具有自己独有的空间自相关分析。主要分析内容包含以下几点: 基本统计量 统计量是数据特征的反映,也是统计分析的基础。 探索性数据分析 探索性数据分析能让用户更深入了解数据,认识研究对象,从而对与其数据相关的问题做出更好的决策。探索性数据分析主要包括确定统计数据属性、探测数据分布、全局和局部异常值(过大值或过小值)、寻求全局的变化趋势、研究空间自相关和理解多种数据集之间相关性。 分级统计分析 分级统计是对数据的进一步处理分析,以便于更好得揭示数据规律或在制图中获得更好的效果。 空间插值 基于探索性数据分析结果,选择合适的数据内插模型,由已知样点来创建表面,研究空间分布。 空间回归 研究两个或两个以上的变量之间统计关系,通过空间关系,包括考虑空间的自相关性,把属性数据与空间位置关系结合起来,更好的解释地理事物的空间关系。 空间分类 基于地图表达,采用与变量聚类分析相类似的方法来产生新的综合性或者简洁性专题地图。包括多变量统计分析,如主成分分析、层次分析,以及空间分类统计分析,如系统聚类分析、判别分析等。 10.2基本统计量 平均数中位数众数分位数 偏度峰度 总和比率比例种类 集中趋势 描述数据特征的统计量 离散程度 基本统计量 其他统计量 分布形状 极值极差离差平均离差离差平方和方差标准差变差系数 常用的基本统计量主要包括:最大值、最小值、极差、均值、中值、总和、众数、种类、离差、方差、标准差、变差系数、峰度和偏度等。这些统计量反映了数据集的范围、集中情况、离散程度、空间分布等特征,对进一步的数据分析起着铺垫作用(见图10.1)。 图10.1基本统计量 10.2.1代表数据集中趋势的统计量 代表数据集中趋势的统计量包括平均数、中位数、众数,它们都可以用来表示数据的分布位置和一般水平。 表10.1中,列出了各统计量的含义以及在实际应用的作用。其中,表示数据集中的第i个变量,i=1,2,……,n。