预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第11章医学研究解决什么问题? 多重线性回归分析 multiplelinearregression? 12 问题提出:由于涉及到的自变量增多 变量间的关系变的复杂? 医学生物现象的形成、发生、发展和 变化是多种因素在一定条件下相互影响、 相互制约产生的共同结果。如年龄、性别、 精神紧张、饮食、劳动强度、吸烟状况、 ?利用多重线性回归方程 家族史等,在影响疾病众多因素中,哪些 对医学现象进行推断和 是主要因素?各个因素作用有多大?是研 预测。 究者关心的问题。 4 多重线性回归 多重线性回归? 是研究一个因变量和多个自变量之间线性 关系的统计学分析方法。 目的是用一组自变量(X1,X2,…,XP)的 数值估计一个反应变量(Y)的依存关系 及其变异性的分析。 56 1 11.1概念及其统计描述 一、概述 例1为了研究有关糖尿病患者体内脂联素水平 的影响因素,某医师测定了30名患者的体重 指数BMI(㎏/㎡)、病程DY(年)、瘦素 LEP(ng/ml)、空腹血糖FPG(mmol/L)及脂联 以上数据表可见,除增加了自变量的列数之外,数据结 素水平,数据如下表所示: 构与简单回归的数据表完全相同。 回顾:上一讲我们讲了直线方 简单线性回归: 回归系数?程的求法以及根据方程Yˆ=a+bX;若已知X 可求出估计值Yˆ;可以在散点图上画出它 Yˆ=a+bX的直线。又提出该直线方程是否成立?建立 假设检验,方法有两种: MS ①方差分析F=回 MS残 µ=α+βX Y|Xbb ②t检验t== S2 bSY⋅X/∑(X−X) 两个结果一致:t=F10 多重线性回归分析的基本目的是用以上的一组样本多重线性回归方程为: 自变量(X1,X2,…,XP)的数值估计一个反应变 ˆ(11-2) 量(Y)及其变异性的统计分析方法。Y=b0+b1X1+b2X2+⋅⋅⋅+bPXP 其中,b为回归的常数项,是β的估计值,b(j=1,2,⋅⋅⋅,P) 多重线性回归的数学模型为:00j 称为Y对自变量Xj的偏回归系数。bj的意义为:在其它自 Y的平均数=β0+β1X1+β2X2+⋅⋅⋅+βPXP(11-1)变量固定不变的条件下,Xj改变一个计量单位,反应变 量Y的平均值变化bj个单位数。 相应的参数由样本估计 2 问题是:在许多的情况下需要比较自变量对 P个自变量的计量单位以及不同的变异,不能 因变量Y贡献的相对大小? 直接用普通偏回归系数的数值大小来反映方程 X1X2X3…Xp中各个自变量对反应变量的贡献大小。可将 Y体重指数病程瘦素Y 脂联素等等 原始观测数据进行标准化。 由于各自变量测量单位不等,不能直接比 (11-3) 较,将原始观测数据进行标准化。 经标化的偏回归系数,称为标准化偏回归系数。 计算的偏回归系数称标准化偏回归系数。标准化偏回归系数越大,表示自变量对反应变 量Y的贡献越大。 13 二、偏回归参数的估计计算公式和图示 n 它的前提条件完全与简单线性回归相同:线性、2Y SS总=∑(Yi−Y) 独立、正态和等方差,即LINE。i=1 n ˆ2 基本原理:SS回=∑(Yi−Y) i=1X 采用最小二乘法来估计未知参数,利用收集到1 nTotalSS 因变量和自变量的数据建立一个因变量关于自2X2 SS=(Y−Yˆ)ModelSS 变量的线性函数模型,使得这个模型的理论值残∑ii i=1ResidualSS 和观察值之间的离差平方之和尽可能小。 1516 11.2.3统计推断 通过计算机统计软件完成 一、整体回归效应的假设检验(方差分析) 对例题,整体方程进行假设检验,方差分析结 本例题的回归方程如下:1 见下表所示,建立假设检验: ˆ Y=58.199−1.030X1−0.132X2−0.811X3−0.579X4H0:β1=β2=β3=β4=0 问题:我们能不能根据回归方程下结论? ?17 3 从方差分析表中可计算确定系数,其定义为: 由上表显示:P<0.0001,拒绝H0。说明 从整体上而言,用这四个自变量构成的 2SS回 回归方程解释糖尿病患者体内脂联素的R=(11−4) SS总 变化是有统计学意义的。 用以反映线性回归模型能在多大程度上解释反应 变量Y的变异性的百分比;以反映回归方程效果 优劣。 19 R2的值接近于1(0~1),说明回归方程的效果对例1,由方差分析表得知: 越好。表示样本数据能较好地拟合了选用的线性 SS1773.343 回归模型。R2=回==0.7312 SS总2425.301 2 对总体R=0的假设完全等价于回归方由R2可知:用包含体重指数、病程、瘦素与空 程的整体方差分析。腹血糖四个变量的回归方程解释脂联素水平的 变异的73.12%。