预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共28页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

多元线性回归分析主要内容第一节:多元线性回归概念及统计描述多元线性回归数据结构多元线性回归模型标准化偏回归系数偏回归系数的估计--最小二乘法多元线性回归分析前体条件——LINE通过反应变量控制自变量 06941*ratio 并通过F检验加入自变量对模型的影响是否显著。 第二节:多元线性回归假设检验 SXi、SY分别为Xi和Y的标准差。 例:血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史 (3)normaldistribution:在一定范围内,对任意一组自变量X1,X2,…,Xm值,Y都服从正态分布。 通过反应变量控制自变量 步骤:1、根据专业知识绘制变量间的通径图。 inputlandtaxratiobedroomsroomsareaprice;/*要输入的变量*/ 第三节、多元线性回归自变量的筛选 R2=1-SS残/SS总 需要求出标准化偏回归系数。 步骤:1、根据专业知识绘制变量间的通径图。 第一节:多元线性回归概念及统计描述 3、将各系数添加到通径图上。 R2反映了线性回归模型能多大程度上解释Y的变异。多元线性回归决定系数第二节:多元线性回归假设检验二、回归系数的假设检验(t检验) 在F检验中,如果拒绝H0假设,只能说β1,β2…βp不全为0,还需要进一步检查每个自变量的总体偏回归系数。 H0:βi=0,H1:βi≠0(i=1,2…p) 如果H0成立,认为偏回归系数βi不显著,如果拒绝H0,认为偏回归系数βi显著。 第三节、自变量的筛选自变量筛选的标准和原则自变量筛选的方法通径分析是一种在回归基础上的拓展,用以处理这种具有复杂变量关系的方法。 需要求出标准化偏回归系数。 多元回归分析时收集的某些自变量对因变量无影影响或影响甚微; ━━━━━━━━━━━━━━━━━━━━━━ 58365*land+71. SXi、SY分别为Xi和Y的标准差。 H0:βi=0,H1:βi≠0(i=1,2…p) 第五节:多元线性回归应注意问题 modelprice=landtaxratiobedroomsroomsarea/selection=stepwise;/*采用逐步筛选法*/ R2=1-SS残/SS总 modelprice=landratioarea;plotresidual. 2、按照通径图建立线性方程。 例:血压值与年龄、性别、劳动强度、饮食习惯、吸烟状况、家族史 H0:β1=β2=…=βp=0H1:β1,β2…βp不全为0 采用REG过程对数据进行多元线性回归分析,编程如下: 06941*ratio 在多元线性回归模型中,由于变量众多,需要对模型的合理性以及参数的显著性进行检验。 06941*ratio第五节:多元线性回归应注意问题交互效应 当回归模型中有多于2个的自变量,变量之间可能存在交互作用(一自变量对应变量的作用大小与另一个自变量的取值有关),此时可建立包含各自变量及其某些有交互作用的自变量的乘积(X1X2)的回归模型。 例如:A、B两种药物对帕金森综合症都有作用,而且相信联合用药效果更好,为探讨联合用药可行性,进行了随机对照临床试验。最终的得到的回归方程为: Ỷ=49-2.5X1+1.9X2+0.2X1X2 非同质性资料合并 哑变量设置 多元线性回归分析中自变量可以是连续的(年龄、血压),也可以是二分类的(性别),不能把有序变量(高、中、低)和无序多分类变量直接纳入分析。必须先将有序变量或多分类无序变量转换成多个二分类变量,再进行回归分析。 通径分析 当多元回归自变量较多时,相互间的关系十分复杂,有的自变量并不是直接对反应变量产生影响,而是通过对其他自变量的作用间接地影响反应变量。通径分析是一种在回归基础上的拓展,用以处理这种具有复杂变量关系的方法。 例如:回归模型后,自变量X1、X2对Y贡献甚微,但从专业知识考虑X1、X2是通过X3、X4影响Y的,这时就需要通径分析。 步骤:1、根据专业知识绘制变量间的通径图。2、按照通径图建立线性方程。3、将各系数添加到通径图上。4、根据通径图计算各变量对Y的直接、间接效应。第六节:实例分析(SAS)SAS分析过程利用PLOT语句绘制模型的残差图感谢观看