预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共68页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第十二章多重线性回归分析 复习1概述给定X时,Y是正态分布、等方差示意图2回归模型的前提假设(1)a为回归直线在Y轴上的截距。(2)b为回归系数,即直线的斜率。回归方程的方差分析6因变量总变异的分解Y的总变异分解Y的总变异分解方差分析表决定系数回归系数的t检验回归系数与相关系数的假设检验直线回归中三种假设检验间的关系线性回归的应用的可信区间与Y的预测区间如何建立回归模型?outline多重线性回归1.1多元线性回归模型简介1.2回归模型的前提假设最小二乘法(leastsquareestimation,LSE) 基本思想:使各实测值Y与对应的估计值之差的平方和为最小。 只有一个自变量两个自变量例12-1为了研究有关糖尿病患者体内脂联素水平的影响因素,某医师测定30例患者的BMI、病程、瘦素、空腹血糖,数据如表12-1所示。1.3估计回归参数,建立回归模型2.多重线性回归的假设检验Y的总变异分解 总变异SS总: 剩余平方和SS剩或残差平方和: 回归的贡献,回归平方和SS回:Y的总变异分解回归方程的方差分析表回归方程的方差分析回归方程的方差分析表扣除其他变量的影响后,Y和X的相关,称为Y与X的偏相关系数。方差分析和决定系数检验所有自变量整体对应变量的相关程度。 未指明方程中的每一个自变量对Y的影响。 而在实际工作中往往会关心的是每个变量的解释。2.3.1.偏回归平方和382.3.2偏回归系数的假设检验---t检验2.3.2偏回归系数的假设检验---t检验2.3.2偏回归系数的假设检验---t检验422.3.3标准化偏回归系数2.3.3标准化偏回归系数扣除其他变量的影响后,Y和X的相关,称为Y与X的偏相关系数。 偏相关系数,绝对值越大,偏相关程度越大。因偏相关系数反映的是排除其他变量的影响后,自变量与因变量之间的相关程度,没有单位,故偏相关系数的绝对值大小也常用于表示各变量的相对重要性,取值范围在-1和1之间。 正负符号始终与标准化偏回归系数相同。46473自变量筛选4.1自变量筛选的标准4.1自变量筛选的标准4.1自变量筛选的标准4.2自变量筛选的常用方法1)所有可能自变量子集选择-全局择优法仍以例12-1数据为例,通过统计软件获得所有可能自变量子集的运算结果。2)前向选择(forwardselection)3)后向选择(backwardselection)4)逐步选择(stepwiseselection)58多元线性回归的应用及注意事项一、多元线性回归的应用2.指标的数量化分2类,可用一个(0,1)变量。如性别数据格式回归方程b1,b2,b3分别反映中学、大学、大学以上相对于小学文化程度者经济收入差别的大小如果方程中自变量不多,样本含量较大,用哑变量较好; 如果方程中自变量较多,样本含量较小,按连续变量较好。3.样本含量:n=(5~10)m。 4.关于逐步回归:逐步回归可较有效的遏制有较强相关关系的自变量同时进入方程。 但对逐步回归得到的结果不要盲目的信任,所谓的“最优”回归方程并不一定是最好的,没有选入方程的变量也未必没有统计学意义如果将选入标准和剔除标准改变,则选入的变量结果也可能会发生改变。 不同回归方程适应于不同用途,依专业知识定。小结: