预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共51页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第六章相关分析与回归分析第一节相关分析1.函数关系2.相关关系相关关系的特点:具有相关关系的某些现象可表现为因果关系。 自变量:是引起某种结果变化的原因,它是可以控制、给定的值,常用x表示; 因变量:是自变量变化的引起结果量,它是不确定的值,常用y表示。二、相关关系的种类4.按研究变量的多少可分为单相关、偏相关和复相关 单相关:两个变量之间的相关,称为单相关。 复相关:一个变量与两个或两个以上其他变量之间的相关,称为复相关。 偏相关:在复相关的研究中,假定其他变量不变,专门研究其中两个变量之间的相关关系时称其为偏相关。三、相关关系的测定(一)相关表:将自变量x的数值按照从小到大的顺序,并配合因变量y的数值一一对应而平行排列的表。 (二)相关图(散点图) 识别变量间相关关系最简单的方法是散点图法。 所谓散点图法,就是将所研究变量的观察值以散点的形式绘制在相应的坐标系中,通过它们呈现出的特征,来判断变量之间是否存在相关关系,以及相关的形式、相关的方向和相关的程度等。【例】在研究我国人均消费水平的问题时,把全国人均消费记为y,把人均国内生产总值(人均GDP)记为x。 我国人均国内生产总值与人均消费金额数据单位:元所绘制的散点图呈现出从左至右的上升趋势,它表明x与y之间存在着一定的正相关关系,即随着人均GDP的上升,人均消费金额也会增加。有时也可通过表格来直接观察变量之间是否存大相关关系。(a)正相关\直线相关(二)相关系数 相关图表可反映两个变量之间的相互关系及其相关方向,但无法确切地表明两个变量之间相关的程度。 统计学家卡尔·皮尔逊设计了统计指标–––相关系数。 简单相关系数:在线性条件下说明两个变量之间相关关系密切程度的统计分析指标,简称相关系数。 根据总体全部数据计算的,称为总体相关系数,记为;根据样本数据计算的,则称为样本相关系数,记为r。 将反映两变量间曲线相关关系的统计指标称为非线性相关系数、非线性判定系数;将反映多元线性相关关系的统计指标称为复相关系数、复判定系数等。1、由未分组资料计算相关系数公式:2021将上表计算结果代入公式为:-1.0(1)当r>0时,表示两变量正相关,r<0时,两变量为负相关。 (2)当|r|=1时,表示两变量为完全线性相关,即为函数关系。 (3)当r=0时,表示两变量间无线性相关关系,它并不意味着X与Y之间不存在其他类型的关系。。 (4)当0<|r|<1时,表示两变量存在一定程度的线性相关。且|r|越接近1,两变量间线性关系越密切;|r|越接近于0,表示两变量的线性相关越弱。 (5)通常判断的标准是: |r|<0.3称为微弱相关; 0.3≤|r|<0.5称为低度相关; 0.5≤|r|<0.8称为显著相关; 0.8≤|r|<1称为高度相关或强相关。4、相关系数取正值或是负值,与分子有直接的关系.它可能出现以下情况: 1)所有相关点都为正相关,则>0,说明两变量之间正线性相关; 2)所有相关点都为负相关,则<0,说明两变量之间负线性相关; 3)在全部相关点中,既有正相关、又有负相关和零相关,这时计算协方差时就会出现正负抵消。抵消的结果为正数,为正相关;为负数就是负相关.四、相关分析中应注意的问题第二节一元线性回归分析一、回归分析的概念2、相关分析与回归分析的关系二者的区别: (1)相关分析中变量之间的关系是对等的;回归分析中,变量之间的关系是不对等的,将变量划分自变量和因变量。 (2)相关分析中变量都必须是随机变量;回归分析中,自变量是给定的,因变量是随机的。 (3)相关分析主要是通过一个指标即相关系数来反映变量之间相关程度的大小,相关系数是惟一的。而在回归分析中,对于互为因果的两个变量,则有可能存在两个或多个回归方程。3、回归分析的种类4、回归分析步骤: 首先对变量之间的关系进行相关分析,并将变量分为自变量和因变量; 其次,找出合适的回归模型(即数学方程式),描述变量间的关系; 再次,对回归模型进行统计检验; 最后,统计检验通过后,利用回归模型,根据自变量去估计、预测因变量。 本节仅讨论一元线性回归分析。当只涉及一个自变量时称为一元回归,若因变量y与自变量x之间为线性关系时称为一元线性回归。 对于具有线性关系的两个变量,可以用一条直线方程来表示它们之间的关系。 描述因变量y如何依赖于自变量x和误差项的方程称为回归模型。在回归分析中,欲使所求回归直线y=a+bx最适合于实际资料,必须使每个xi对应的指标实测值yi与回归直线确定的估计值yi的离差平方之和为最小。这样便把寻找适当直线问题转化为使Q(a,b)达到最小条件下求出a、b的问题。满足上述条件的a、b即为所求的未知参数。上述方程组称为标准方程组。解之,得:将上述结果代入即可确定回归方程式为:教育经费(万元)x回归分析计算表(1)建立回