预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共43页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第十三章多重线性回归与相关多重回归(multiplelinearregression)与多重相关(multiplecorrelation)是研究一个因变量和多个自变量之间线性关系的统计学分析方法。第一节多重线性回归的概念及其统计描述bj为自变量Xj的偏回归系数(partialregressioncoefficient),是βj的估计值,表示当方程中其他自变量保持常量时,自变量Xj变化一个计量单位,反应变量Y的平均值变化的单位数。标准化偏回归系数(standardizedpartialregressioncoefficient),又称为通径系数(pathcoefficient)。标准化偏回归系数b’j较大的自变量在数值上对反应变量Y的作用较大。回归参数的估计:第二节多重线性回归的假设检验表13-2显示,P<0.0001,拒绝H0。说明从整体上而言,用这四个自变量构成的回归方程解释空气中NO浓度的变化是有统计学意义的。偏回归系数的t检验第三节复相关系数与偏相关系数复相关系数(multiplecorrelationcoefficient)R 定义为确定系数的算术平方根,表示变量Y与k个自变量(X1,X2,…Xk)线性相关的密切程度。调整的R2(AdjustedR-Square):当回归方程中包含有很多自变量,即使其中有一些自变量(如本例中的X3)对解释反应变量变异的贡献极小,随着回归方程的自变量的增加,R2值表现为只增不减,这是复相关系数R2的缺点。调整的R2记为,定义为偏相关系数r0.05=0.602原来冷饮销售量和气温正相关, 游泳人数和气温也正相关, 冷饮销售量和游泳人数的正相关 是气温造成的假象, 扣除气温的影响之后两者就不相关了。第四节自变量筛选一、自变量筛选的标准与原则2.残差均方(MSE)缩小与调整确定系数(Ra2)增大3.统计量:二、自变量筛选的常用方法1.全局择优法2.前向选择(forwardselection)3.后向选择(backwardselection)4.逐步选择(stepwiseselection)小结电脑实验:回归的区间估计、异常值影响及共线性问题实验目的:区间估计区间估计讨论:Ex9-2(异常值)讨论:Ex9-3(共线性)1.为什么有时候多重回归中会出现以下现象?2.如果存在共线性现象,该如何解决?