预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共82页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第七章相关和回归分析变量间的关系§7.1问题的提出(1)总体看来有个上升趋势;即初三时成绩 相对较高的学生,在高一时的成绩也较 高。 为研究家庭收入情况对学生成绩变化的影响,下面点出两个盒形图,左边一个是不同收入群体的高一成绩的盒形图,右边一个是不同收入群体的高一和初三成绩之差的盒形图。年龄和观点的散点图(左)和性别与观点的条形图这里因变量(观点)是定性变量,而自变量既有定量变量(年龄),又有定性变量(性别),如何能够找到一个数学模型来描述他们的关系呢?§7.2定量变量的相关不相关例7.3广告投入和销售之间的关系这是什么关系?这是什么关系?变量之间的相关关系定性变量间的关系(关于某项政策调查所得结果)定性和定量变量间的混合关系相关分析的基本方法之一:绘制散点图相关分析的基本方法之一:计算相关系数相关分析的基本方法之一:计算相关系数Kendallτ等级相关系数(Kendall’st)这里的度量原理是把所有的样本点配对(如果每一个点由x和y组成的坐标(x,y)代表,一对点就是诸如(x1,y1)和(x2,y2)的点对),然后看每一对中的x和y的观测值是否同时增加(或减少)。比如由点对(x1,y1)和(x2,y2),可以算出乘积(x2-x1)(y2-y1)是否大于0;如果大于0,则说明x和y同时增长或同时下降,称这两点协同(concordant);否则就是不协同。如果样本中协同的点数目多,两个变量就更加相关一些;如果样本中不协同(discordant)的点数目多,两个变量就不很相关。Spss中的相关系数计算与检验以例7.1来说明相关系数的计算。 在例7.1中数据中,除了初三和高一的成绩之外,还有一个定性变量。 它是学生在高一时的家庭收入状况;它有三个水平:低、中、高,分别在数据中用1、2、3表示。 初三和高一的成绩的相关系数下面是对三种收入对高一成绩和高一与初三成绩差的盒形图高一成绩与家庭收入的相关系数初三成绩与家庭收入的相关系数高一与初三成绩之差与家庭收入的相关系数偏相关分析Spss中的偏相关系数计算与检验高一成绩作为控制变量, 初三成绩与家庭收入的相关系数初三成绩作为控制变量,高一成绩与家庭收入的相关系数回归分析回归分析首先需要确定选择这条直线的标准。这里介绍最小二乘回归(leastsquaresregression)。 这就是寻找一条直线,使得所有点到该直线的垂直距离的平方和最小。用数据寻找一条直线的过程也叫做拟合(fit)一条直线。回归分析—最小二乘法的原理回归方程的检验问题等多个自变量的回归回归分析的类型因变量与自变量都是 定量变量的回归分析例7.1(继续)根据计算,找到初三成绩和高一成绩的回归直线。计算机输出给出来截距(Constant)26.444和斜率(变量j3的系数)0.651。这个直线实际上是对所假设的下面线性回归模型的估计(这里的e是随机误差):由于不同的样本产生不同的估计,所以估计量是个随机变量,它们也有分布,也可以用由它们构造的检验统计量来检验b0和b1是不是显著。拿回归主要关心的来说,假设检验问题是除了对变量的检验之外,还有一个说明自变量解释因变量变化百分比的度量,叫做决定系数(coefficientofdetermination,也叫测定系数或可决系数),用R2表示。 对于例1,R2=0.632;这说明这里的自变量可以大约解释63%的因变量的变化。R2越接近1,回归就越成功。由于R2有当自变量数目增加而增大的缺点,人们对其进行修改;有一修正的R2(adjustedRsquare)。此外,计算机还计算了一个在零假设下有F分布的检验统计量,它是用来检验回归拟合好坏的(零假设是因变量和自变量没有关系)。和刚才简单的回归模型类似,一般的有k个(定量)自变量x1,x2…,xk的对因变量y的线性回归模型为(称为多元回归)并且用数据来拟合所选的一个模型时,并不一定所有的变量都显著(并不一定所有的系数都有意义)。 软件有一种一边回归,一边检验的所谓逐步回归(stepwiseregression)方法。 该方法或者从只有常数项开始,逐个地把显著的变量加入;或者从包含所有变量的模型开始,逐步把不显著的变量减去。注意不同方向逐步回归的结果也不一定相同。 例7.4有关我国民用航空数据 进行变量的相关分析进行回归分析-enter进行回归分析-enter进行回归分析-stepwise进行回归分析-stepwise进行回归分析-stepwise进行回归分析-stepwise自变量中有定性变量的回归自变量中有定性变量的回归Logistic回归例7.2这是200个不同年龄和性别的人对某项服务产品的认可的数据(logi.sav)。这里年龄age是定量变量,性别sex是有男和女(分别用1和0表示)两个水平的定性变量,而变量观点opi