预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共52页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第9章spss的相关分析和线性回归分析相关分析和回归分析是统计分析方法中最重要内容之一,是多元统计分析方法的基础。相关分析和回归分析主要用于研究和分析变量之间的相关关系,在变量之间寻求合适的函数关系式,特别是线性表达式。 本章主要内容: 对变量之间的相关关系进行分析(Correlate)。其中包括简单相关分析(Bivariate)和偏相关分析(Partial)。 建立因变量和自变量之间回归模型(Regression),其中包括线性回归分析(Linear)和曲线估计(CurveEstimation)。 数据条件:参与分析的变量数据是数值型变量或有序变量。本章内容相关分析用于测量了解变量之间的密切程度。如:教育事业的发展与科学技术的发展存在着一定的关系,学生的数学成绩与物理成绩存在着一定的关系,相关分析就是要分析这种密切程度。 相关类型: 1、直线相关:两变量呈线性共同增大,或一增一减。 2、曲线相关:两变量存在相关趋势,但非线性。此时若进行直线相关,有可能出现无相关性的结论,曲线相关分析是一般都先将变量进行变量变换,以将趋势变换为直线分析,或者采用曲线回归方法来分析。 相关的方向依照两种变量变动的方向分,有正相关、负相关和无相关(零相关)。相关分析基本步骤:如果两个定量变量没有关系,就谈不上建立模型或进行回归。但怎样才能发现两个变量有没有关系呢? 最简单的直观办法就是画出它们的散点图。下面是四组数据的散点图;每一组数据表示了两个变量x和y的样本。不相关但如何在数量上描述相关呢?下面引进几种对相关程度的度量。 Pearson相关系数 Spearman秩相关系数 Kendallt相关系数 Pearson相关系数(Pearson’scorrelationcoefficient)又叫相关系数或线性相关系数。它一般用字母r表示。Pearson相关系数的局限性:Spearman秩相关系数Spearman秩相关系数适用范围:侧重于两个分类变量均为有序分类的情况。这里的度量原理是把所有的样本点配对(如果每一个点由x和y的秩组成的坐标(x,y)代表,一对点就是诸如(x1,y1)和(x2,y2)的点对),然后看每一对中的x和y的的秩的观测值是否同时增加(或减少)。比如由点对(x1,y1)和(x2,y2),可以算出乘积(x2-x1)(y2-y1)是否大于0;如果大于0,则说明x和y同时增长或同时下降,称这两点协同(concordant);否则就是不协同。如果样本中协同的点数目多,两个变量就更加正相关一些否则就更负相关些;如果样本中不协同(discordant)与协同的点数差不过一样多,两个变量相关性就弱。Kendall’sτ统计量的数学定义为:人们可能会问,上面的三种对相关的度量都是在其值接近1或-1时相关,而接近于0时不相关。到底如何才能够称为“接近”呢? 这很难一概而论。但在计算机输出中都有和这些相关度量相应的检验和p-值;因此可以根据这些结果来判断是否相关 画散点图 Graphs→Scatter 选择散点图的类型 根据所选择的散点图类型,单击Define对散点图作具体定义。 计算相关系数 Analyze→Correlate→Bivariate 选择参加计算的变量到Variable中 在CorrelationCoefficents框中选择计算哪种相关系数 在TestofSignificance框中选择输出单尾还是双尾p值 选择Flagsignificancecorrelations输出星号标记 在Options中选择其他描述统计量 简单相关分析分析结果本章内容偏相关分析偏相关系数的计算偏相关系数的检验偏相关分析的操作本章内容线性回归分析线性回归模型假设条件与模型的各种检验对初三和高一的各科平均成绩这两个变量的数据进行线性回归,就是要找到一条直线来适当地代表图中的那些点的趋势。首先需要确定选择这条直线的标准。这里介绍最小二乘回归(leastsquaresregression)。古汉语“二乘”是平方的意思。 这就是寻找一条直线,使得所有点到该直线的竖直距离的平方和最小。用数据寻找一条直线的过程也叫做拟合(fit)一条直线。 根据计算,找到初三成绩和高一成绩的回归直线。计算机输出给出来截距(Constant)26.444和斜率(变量j3的系数)0.651。截距=26.444;斜率=0.651这个直线实际上是对所假设的下面线性回归模型的估计(这里的e是随机误差):由于不同的样本产生不同的估计,所以估计量是个随机变量,它们也有分布,也可以用由他们构造检验统计量来检验b0和b1是不是显著。拿回归主要关心的来说,假设检验问题是除了对b1的检验之外,还有一个说明自变量解释因变量变化百分比的度量,叫做决定系数(coefficientofdeterminati