预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10
亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
线性回归
20094788陈磊计算2
-------------------------------------------------------------------
SouthWestJiaoTongUniversity
线性回归分为一元线性回归和多元线性回归。
一元线性回归的模型为Y=훽0+훽1X+ε,这里X是自变量,Y是因变量,ε是随机误差项。
通常假设随机误差的均值为0,方差为휎2(휎2>0),휎2与X的值无关。若进一步假设随机误
差服从正态分布,就叫做正态线性模型。一般情况,设有k个自变量和一个因变量,因变量的
值可以分解为两部分:一部分是由于自变量的影响,即表示为自变量的函数,其中函数形式已
知,但含有一些未知参数;另一部分是由于其他未被考虑的因素和随机性的影响,即随机误差。
当函数形式为未知参数的线性函数时,称为线性回归分析模型。
如果存在多个因变量,则回归模型为:Y=훽0+훽1X1+훽2X2+⋯+훽iXi+휀。由于直线模
型中含有随机误差项,所以回归模型反映的直线是不确定的。回归分析的主要目的是要从这些
不确定的直线中找出一条最能拟合原始数据信息的直线,并将其作为回归模型来描述因变量和
自变量之间的关系,这条直线被称为回归方程。
通常在回归分析中,对ε有以下最为常用的经典假设。
1、ε的期望值为0.
2、ε对于所有的X而言具有同方差性。
3、ε是服从正态分布且相互独立的随机变量。
对线性回归的讲解,本文以例题为依托展开。在下面的例题中既有一元回归分析,又有二
元回归分析。
例题(《数据据分析方法》_习题2.4_page79)
某公司管理人员为了解某化妆品在一个城市的月销量Y(单位:箱)与该城市中
适合使用该化妆品的人数푋1(单位:千人)以及他们人均月收入푋2(单位:元)之间
的关系,在某个月中对15个城市作了调查,得到上述各量的观测值如表2.12所示。
表2.12化妆品销售数据
城市销量(y)人数(x1)收入(x2)城市销量(y)人数(x1)收入(x2)
1162274245091161952137
212018032541055532560
32233753802112524304020
41312052838122323724427
567862347131442362660
61692653782141031572088
781983008152123702605
81923302450
假设Y与푋1,푋2之间满足线性回归关系
푦푖=훽0+훽1푥푖1+훽2푥푖2+휀푖,푖=1,2,…,15
2
其中휀푖独立同分布于푁(0,휎).
2
(1)求线性回归系数훽0,훽1,훽2的最小二乘估计和误差方差휎的估计,写出回归方程并
对回归系数作解释;
(2)求出方差分析表,解释对线性回归关系显著性检验结果。求复相关系数的平方푅2的
值并解释其意义;
(3)分别求훽1和훽2的置信度为95%的置信区间;
(4)对α=0.05,分别检验人数푋1及收入푋2对销量Y的影响是否显著,利用与回归系数
有关的一般假设检验方法检验푋1和푋2的交互作用(即푋1푋2)对Y的影响是否显著;
数据导入
在编辑窗口输入此题的数据导入代码:
title‘《数据据分析方法》_习题2.4_page79’;/*标题,省略不影响分析结果*/
datamylib.ch2_2_4;/*首先新建逻辑库,在逻辑库mylib中创建数据集ch2_2_4*/
inputyx1x2@@;/*@@表示可连续输入,y为因变量,x1、x2是自变量*/
cards;/*开始输入数据*/
162274245012018032542233753802
1312052838678623471692653782
8198300819233024501161952137
5553256025243040202323724427
144236266010315720882123702605
;
/*遗漏数据用“.”表示,否则对应的这组数据会被自动删除*/
run;/*run语句用于说明处理当前程序步中该语句之前的所有行*/
按F8运行后,打开逻辑库mylib即可看到新建的数据集ch2_2_4。SAS提供了多种导入数
据的方式,比如:
1、从文件读入数据,infile‘F:\mylib\ch2_2_4.txt’;
2、利用已经建立过数据集,procregdata=mylib.ch2_2_4;
另外还可以从外部直接导入Excel等方式。上面的程序,是直接在编辑框内输入。
过程调用
本题所要调用的过程是procreg过程。procreg过程是SAS系统中众多回归分析过程的
一种,它