预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共13页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

线性回归 20094788陈磊计算2 ------------------------------------------------------------------- SouthWestJiaoTongUniversity 线性回归分为一元线性回归和多元线性回归。 一元线性回归的模型为Y=훽0+훽1X+ε,这里X是自变量,Y是因变量,ε是随机误差项。 通常假设随机误差的均值为0,方差为휎2(휎2>0),휎2与X的值无关。若进一步假设随机误 差服从正态分布,就叫做正态线性模型。一般情况,设有k个自变量和一个因变量,因变量的 值可以分解为两部分:一部分是由于自变量的影响,即表示为自变量的函数,其中函数形式已 知,但含有一些未知参数;另一部分是由于其他未被考虑的因素和随机性的影响,即随机误差。 当函数形式为未知参数的线性函数时,称为线性回归分析模型。 如果存在多个因变量,则回归模型为:Y=훽0+훽1X1+훽2X2+⋯+훽iXi+휀。由于直线模 型中含有随机误差项,所以回归模型反映的直线是不确定的。回归分析的主要目的是要从这些 不确定的直线中找出一条最能拟合原始数据信息的直线,并将其作为回归模型来描述因变量和 自变量之间的关系,这条直线被称为回归方程。 通常在回归分析中,对ε有以下最为常用的经典假设。 1、ε的期望值为0. 2、ε对于所有的X而言具有同方差性。 3、ε是服从正态分布且相互独立的随机变量。 对线性回归的讲解,本文以例题为依托展开。在下面的例题中既有一元回归分析,又有二 元回归分析。 例题(《数据据分析方法》_习题2.4_page79) 某公司管理人员为了解某化妆品在一个城市的月销量Y(单位:箱)与该城市中 适合使用该化妆品的人数푋1(单位:千人)以及他们人均月收入푋2(单位:元)之间 的关系,在某个月中对15个城市作了调查,得到上述各量的观测值如表2.12所示。 表2.12化妆品销售数据 城市销量(y)人数(x1)收入(x2)城市销量(y)人数(x1)收入(x2) 1162274245091161952137 212018032541055532560 32233753802112524304020 41312052838122323724427 567862347131442362660 61692653782141031572088 781983008152123702605 81923302450 假设Y与푋1,푋2之间满足线性回归关系 푦푖=훽0+훽1푥푖1+훽2푥푖2+휀푖,푖=1,2,…,15 2 其中휀푖独立同分布于푁(0,휎). 2 (1)求线性回归系数훽0,훽1,훽2的最小二乘估计和误差方差휎的估计,写出回归方程并 对回归系数作解释; (2)求出方差分析表,解释对线性回归关系显著性检验结果。求复相关系数的平方푅2的 值并解释其意义; (3)分别求훽1和훽2的置信度为95%的置信区间; (4)对α=0.05,分别检验人数푋1及收入푋2对销量Y的影响是否显著,利用与回归系数 有关的一般假设检验方法检验푋1和푋2的交互作用(即푋1푋2)对Y的影响是否显著; 数据导入 在编辑窗口输入此题的数据导入代码: title‘《数据据分析方法》_习题2.4_page79’;/*标题,省略不影响分析结果*/ datamylib.ch2_2_4;/*首先新建逻辑库,在逻辑库mylib中创建数据集ch2_2_4*/ inputyx1x2@@;/*@@表示可连续输入,y为因变量,x1、x2是自变量*/ cards;/*开始输入数据*/ 162274245012018032542233753802 1312052838678623471692653782 8198300819233024501161952137 5553256025243040202323724427 144236266010315720882123702605 ; /*遗漏数据用“.”表示,否则对应的这组数据会被自动删除*/ run;/*run语句用于说明处理当前程序步中该语句之前的所有行*/ 按F8运行后,打开逻辑库mylib即可看到新建的数据集ch2_2_4。SAS提供了多种导入数 据的方式,比如: 1、从文件读入数据,infile‘F:\mylib\ch2_2_4.txt’; 2、利用已经建立过数据集,procregdata=mylib.ch2_2_4; 另外还可以从外部直接导入Excel等方式。上面的程序,是直接在编辑框内输入。 过程调用 本题所要调用的过程是procreg过程。procreg过程是SAS系统中众多回归分析过程的 一种,它