预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共310页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

相关分析与回归分析专题(Correlation&regression)相关分析(CorrelationAnalysis)一、相关分析的意义: 研究问题过程:单变量分析双变量分析多变量分析 多变量分析与单变量分析的最大不同:揭示客观事物之间的关联性。 所以,相关分析的意义和目的在于: (1)在统计学中有理论与实践意义 (2)对相关关系的存在性给出判断 (3)对相关关系的强度给出度量和分析二、相关分析的概念 变量之间的关系分为确定性关系和非确定性关系。 确定性关系:当一个变量值(自变量)确定后,另一个变量值(因变量)也就完全确定了,确定性关系往往可以表示成一个函数的形式,比如圆的面积和半径的关系:S=πr² 非确定性关系:给定了一个变量值后,另一个变量值可以在一定范围内变化,例如家庭的消费支出和家庭收入的关系。 研究者把非确定性关系称为相关关系。三.相关分析的特点和应用 相关关系是普遍存在的,函数关系仅是相关关系的特例。 1.相关关系的类型 相关关系多种多样,归纳起来大致有以下6种: 强正相关关系,其特点是一变量X增加,导致另一变量Y明显增加,说明X是影响Y的主要因素。 弱正相关关系,其特点是一变量X增加,导致另一变量Y增加,但增加幅度不明显。 强负相关关系,其特点是X增加,导致Y明显减少,说明X是影响Y的主要因素弱负相关关系,其特点是变量X增加,导致Y减少,但 减少幅度不明显,说明X是Y的影响因素,但不是唯一 因素。 非线性相关关系,其特点是X、Y之间没有明显的线性 关系,却存在着某种非线性关系,说明X仍是影响Y的 因素。 不相关,其特点是X、Y不存在相关关系,说明X不是 影响Y的因素。2.相关分析的应用 (1)相关分析可以在影响某个变量的诸多变量中判断哪些是显著的,哪些是不显著的。而且在得到相关分析的结果后,可以用于其他分析,如回归分析和因子分析。 (2)相关分析方法已广泛用于心理学、教育学、医学、经济学等各学科。它对试验数据的处理、经验公式的建立、管理标准的测定、自然现象和经济现象的统计预报,都是一种方便而且有效的工具。四、相关系数相关系数的计算Pearson相关系数应用广泛,其计算公式及其性质如下:在Analyze的下拉菜单Correlate命令项中有三个相关分析功能子命令: Bivariate(两两相关分析过程) Partial(偏相关分析过程) Distances(距离分析过程)Bivariate过程 Bivariate过程用于进行两个或多个变量间的参数与非参数相关分析,如为多个变量,给出两两相关的分析结果。这是correlate菜单中最常用的一个过程,包括自动计算Pearson简单相关系数、T检验统计量和对应的概率P值。 举例:对肺活量和体重做相关分析 1.打开SAV数据。 2.用散点图初步观察两变量间有无相关趋势,依次单击菜单“Graphs-ChartBuilder”打开图形构建器,选择做散点图(Scatter/Dot)。 3.设置相关分析的参数。 依次单击“Analyze-Correlate-Bivariate”执行两变量相关分析。其主设置面板如图所示:(2)相关性输出,“相关性”表格给出的是Pearson相关系数及其检验结果:“相关系数”表格给出的是两个非参数相关系数及其检验结果。可见,3个相关系数在0.01和0.05的显著性水平(双边检验)上都非常显著,从而推断体重和肺活量之间存在着明显的正相关关系。Partial过程 偏相关分析也称净相关分析,它在控制其他变量的线性影响下分析两变量间的线性相关,所采用的是工具是偏相关系数(净相关系数)。运用偏相关分析可以有效地揭示变量间的真实关系,识别干扰变量并寻找隐含的相关性。如控制年龄和工作经验的影响,估计工资收入与受教育水平之间的相关关系。 Partial过程,当进行相关分析的两个变量的取值都受到其他变量的影响时,就可以利用偏相关分析对其他变量进行控制,输出控制其他变量影响后的相关系数。 举例: 分析身高与肺活量之间的相关性,要控制体重在相关分析过程中的影响。 1.设置偏相关分析的参数。 依次单击“Analyze-Correlate-Patial”执行偏相关分析。其主设置面板如图所示: 0阶偏相关 (Pearson)(1)描述性输出,“描述性统计量”表格给出了三个变量的基本统计信息,包括均值、标准差和频率。 (2)相关性输出,“相关性”表格给出了所有变量的0阶偏相关(Pearson简单相关)系数和1阶偏相关系数的计算结果果、以及它们各自的显著性检验P值。分析结果显示:在体重不变的条件下,身高与肺活量之间不存在显著线性相关关系。Distances过程距离分析:此过程可以在观测记录之间或者不同变量之间进行相似性和不相似性分析。相似性分析可以用于检测观测值的接近程度