预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共44页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

多重线性回归与相关content目的:作出以多个自变量估计应变量的多元线性回归方程。 资料:应变量为定量指标;自变量全部或大部分为定量指标,若有少量定性或等级指标需作转换。 用途:解释和预报。更精确 意义:由于事物间的联系常常是多方面的,一个应变量的变化可能受到其它多个自变量的影响,如糖尿病人的血糖变化可能受胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂等多种生化指标的影响。第一节多重线性回归的概念与统计推断变量:应变量1个,自变量k个,共k+1个。 样本含量:n 数据格式见表13-1 回归模型一般形式:多元回归分析数据格式车流 (X1)第二节假设检验及其评价多元线性回归方差分析表 变异来源偏回归系数的t检验自变量筛选的标准与原则 (3)t检验不准确,误将应保留在模型中的重要变量舍弃。 (4)估计值的正负符号与客观实际不一致。 偏回归系数的t检验是在回归方程具有统计学意义的情况下,检验某个总体偏回归系数等于零的假设,以判断是否相应的那个自变量对回归确有贡献 目的:作出以多个自变量估计应变量的多元线性回归方程。 理论上最好,建议使用采用此法。 第四节自变量筛选 自变量筛选的标准与原则 1、非同质资料的合并问题 (3)t检验不准确,误将应保留在模型中的重要变量舍弃。 对例13-1,由方差分析表可得:SSR=0. 偏回归系数的t检验是在回归方程具有统计学意义的情况下,检验某个总体偏回归系数等于零的假设,以判断是否相应的那个自变量对回归确有贡献 复相关系数:确定系数的算术平方根 利用SAS对例13-1的四个偏回归系数进行t检验与标准化偏回归系数的结果如表13-3所示。 标准化回归系数变量标准化是将原始数据减去相应变量的均数,然后再除以该变量的标准差。 不同质:此时应按不同性别分别拟合回归模型。 多元线性回归应用的注意事项复相关系数:确定系数的算术平方根 调整的R2(AdjustedR-Square)当回归方程中包含有很多自变量,即使其中有一些自变量(如本例中的X3)对解释反应变量变异的贡献极小,随着回归方程的自变量的增加,R2值表现为只增不减,这是复相关系数R2的缺点。调整的R2定义为偏相关系数偏相关系数(partialcorrelationcoefficient):一般地,扣除其他变量的影响后,变量Y与X的相关.(二)对各自变量 指明方程中的每一个自变量对Y的影响(即方差分析和决定系数检验整体)。各自变量的偏回归平方和可以通过拟合包含不同自变量的回归方程计算得到结 果06396SSE=0. 理论上最好,建议使用采用此法。 表13-2显示,P<0. 目的:使得预报和(或)解释效果好 表13-2显示,P<0. (1)参数估计值的标准误变得很大,从而t值变得很小。 利用SAS对例13-1的四个偏回归系数进行t检验与标准化偏回归系数的结果如表13-3所示。 消除多重共线性:剔除某个造成共线性的自变量,重建回归方程; 第四节自变量筛选 第四节自变量筛选 第五节多元线性回归的应用与注意事项 标准化回归系数变量标准化是将原始数据减去相应变量的均数,然后再除以该变量的标准差。结论标准化回归系数变量标准化是将原始数据减去相应变量的均数,然后再除以该变量的标准差。注意: 一般回归系数有单位,用来解释各自变量对应变量的影响,表示在其它自变量保持不变时,增加或减少一个单位时Y的平均变化量。不能用各来比较各对的影响大小。 标准化回归系数无单位,用来比较各自变量对应变量的影响大小,越大,对 的影响越大。第四节自变量筛选自变量筛选的标准与原则全局择优法逐步选择法第五节多元线性回归的应用与注意事项多元线性回归应用的注意事项3、样本含量:n=(5~10)m。 4、关于逐步回归:对逐步回归得到的结果不要盲目的信任,所谓的“最优”回归方程并不一定是最好的,没有选入方程的变量也未必没有统计学意义。例如,例15-3中若将选入标准和剔除标准定为和,选入的变量是,而不是,结果发生了改变。 不同回归方程适应于不同用途,依专业知识定。5、多重共线性即指一些自变量之间存在较强的线性关系。如高血压与年龄、吸烟年限、饮白酒年限等,这些自变量通常是高度相关的,有可能使通过最小二乘法建立回归方程失效,引起下列一些不良后果: (1)参数估计值的标准误变得很大,从而t值变得很小。 (2)回归方程不稳定,增加或减少某几个观察值,估计值可能会发生很大的变化。 (3)t检验不准确,误将应保留在模型中的重要变量舍弃。 (4)估计值的正负符号与客观实际不一致。感谢观看