预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共30页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

一元线性回归分析(Simplelinearregression)一、一元线性回归模型(简单线性回归模型)2、一元线性回归方程(Simplelinearregressionequation) 描述y的均值E(y)与x的关系的方程叫做回归方程。 由于 所以 不难看出,简单线性回归方程的图形是一条直线。这条直线被称为总体回归直线。是回归直线的截距,是回归直线的斜率,E(y)是给定某个x的值y的均值或期望值。 各实际观测点与总体回归线垂直方向的间隔,就是随机误差项ε,即 3、估计一元线性回归方程(Estimatedsimplelinearregressionequation) 在实践中,参数往往是未知的,需要用样本数据进行估计。根据样本数据拟合的直线,称为样本回归直线。 分别为的估计值,是样本回归直线的截距和斜率。 实际观测到的因变量y值,并不完全等于估计值,如果用e表示二者之差,则样本回归模型为:样本回归模型与总体回归模型的区别: 第一,总体回归线是未知的,它只有一条;而样本回归线则是根据样本数据拟合的,可以有若干条样本回归线。 第二,总体回归模型中的β0和β1是未知的参数,表现为常数;而样本回归模型中的b0和b1是随机变量,其数值随样本观测值不同而变动。 第三,总体回归模型中的ε,是y与未知的总体回归线之间的纵向距离,它是不可直接观测的;而样本回归模型中的e,是y与样本回归线之间的纵向距离,可以根据样本观测值计算得出。二、一元线性回归模型的估计1、回归系数的估计[例1]假定我们想为某街区内的住宅房地产的销售价格y与评估价值x之间的关系建立一个回归模型,从去年已售出的房地产中随机抽选5所住宅作样本,相应的数据如表所示。直线回归分析步骤例2:某乡为了提高小麦产量,经过多次试验,总结出一种小麦基本苗数推算成熟期有效穗数的方法。在5块田上进行对比试验,取得数据如下:解:回归直线方程计算表(1)回归直线方程计算表(2)练习1:某企业上半年产品产量与单位成本数据如表所示。试根据表中数据:(1)绘制散点图;(2)建立回归方程,说明产量每增加1000件,单位成本平均变动如何?(3)作回归直线。练习2:根据Pizza连锁店的学生人数和季度销售收入数据,建立回归直线方程,并预测学生人数为25人时的销售收入。练习3:以下是采集到的有关女子游泳运动员的身高(英寸)和体重(磅)的数据:a、用身高作自变量,画出散点图b、根据散点图表明两变量之间存在什么关系?c、试着画一条穿过这些数据的直线,来近似身高和体重之间的关系d、求出估计的回归方程e、如果一名运动员的身高是63英寸,你估计她的体重是多少?三、一元线性回归模型的检验1、拟合程度的评价两个变量之间线性相关的强弱可以用相关系数r(Correlationcoefficient)度量。 相关系数(样本中x与y的线性关系强度)计算公式如下: 相关系数的取值范围在-1≤r≤1之间。当r接近于0时,说明x与y之间不相关;当r=1或r=-1时,说明x与y完全相关;当-1<r<1时,说明x与y之间不完全相关。 测定系数与相关系数之间的区别 第一,二者的应用场合不同。当我们只对测量两个变量之间线性关系的强度感兴趣时,采用相关系数;当我们想要确定最小二乘直线模型同数据符合的程度时,应用测定系数。 第二,相关系数仅限定于两个变量之间存在线性关系,而测定系数却可以应用于线性、非线性相关和自变量是两个和两个以上的复相关。 2、显著性检验练习4:对来往车辆进行研究,每隔5分钟获得的数据如下表,试进行回归分析,并对回归方程作拟合度及显著性检验。(显著水平为5%)练习:有10个同类企业的生产性固定资产年平均价值和工业总产值数据如表所示。根据表中数据,1、拟合直线回归方程2、计算估计标准误差3、进行95%的显著性检验4、当固定资产为1100万元时,对工业总产值作点估计和区间估计。第4节多元线性回归(MultipleRegression)分析二、回归系数的最小二乘估计例6:根据表中数据拟合因变量的二元线性回归方程。三、多元线性回归模型的检验和预测2、显著性检验方差分析表[练习2]已知根据下表数据建立的回归方程是:1、检验因变量与自变量之间关系的显著性(显著水平为0.05)2、是否显著?(显著水平为0.05)3、是否显著?(显著水平为0.05)4、计算,并评述拟合优度。多元回归的共线性诊断多重共线性的后果多重共线性的确认解决方案