预览加载中,请您耐心等待几秒...
1/8
2/8
3/8
4/8
5/8
6/8
7/8
8/8

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第十一章多元线性回归与logistic回归 一、教学大纲要求 (一)掌握内容 1.多元线性回归分析的概念:多元线性回归、偏回归系数、残差。 2.多元线性回归的分析步骤:多元线性回归中偏回归系数及常数项的求法、多元线性回归的应用。 3.多元线性回归分析中的假设检验:建立假设、计算检验统计量、确定值下结论。 4.logistic回归模型结构:模型结构、发病概率比数、比数比。 5.logistic回归参数估计方法。 6.logistic回归筛选自变量:似然比检验统计量的计算公式;筛选自变量的方法。 (二)熟悉内容常用统计软件(SPSS及SAS)多元线性回归分析方法:数据准备、操作步骤与结果输出。 (三)了解内容标准化偏回归系数的解释意义。 二、教学内容精要 (一)多元线性回归分析的概念 将直线回归分析方法加以推广,用回归方程定量地刻画一个应变量与多个自变量X间的线形依存关系,称为多元线形回归(multiplelinearregression),简称多元回归(multipleregression) 基本形式: 式中为各自变量取某定值条件下应变量均数的估计值,,,…,为自变量,为自变量个数,为回归方程常数项,也称为截距,其意义同直线回归,,,…,称为偏回归系数(partialregressioncoefficient),表示在除以外的自变量固定条件下,每改变一个单位后的平均改变量。 (二)多元线性回归的分析步骤 是与一组自变量,,…,相对应的变量的平均估计值。 多元回归方程中的回归系数,,…,可用最小二乘法求得,也就是求出能使估计值和实际观察值的残差平方和为最小值的一组回归系数,,…,值。根据以上要求,用数学方法可以得出求回归系数,,…,的下列正规方程组(normalequation): 式中 常数项可用下式求出: (三)多元线性回归分析中的假设检验 在算得各回归系数并建立回归方程后,还应对此多元回归方程作假设检验,判断自变量,,…,是否与真有线性依存关系,也就是检验无效假设(),备选假设为各值不全等于0或全不等于0。 检验时常用统计量 式中为个体数,为自变量的个数。 式中 (四)logistic回归模型结构 设为一组自变量,为应变量。当是阳性反应时,记为=1;当是阴性反应时,记为=0。用表示发生阳性反应的概率;用表示发生阴性反应的概率,显然+=1。 Logistic回归模型为: 同时可以写成: 式中是常数项;是与研究因素有关的参数,称为偏回归系数。 事件发生的概率与之间呈曲线关系,当在之间变化时,或在(0,1)之间变化。 若有例观察对象,第名观察对象在自变量作用下的应变量为,阳性反应记为=1,否则=0。相应地用表示其发生阳性反应的概率;用表示其发生阴性反应的概率,仍然有+=1。和的计算如下: 这样,第个观察对象的发病概率比数(odds)为,第个观察对象的发病概率比数为,而这两个观察对象的发病概率比数之比值便称为比数比(oddsratio)。对比数比取自然对数得到关系式: ln 等式左边是比数比的自然对数,等式右边的是同一因素的不同暴露水平与之差。的流行病学意义是在其它自变量固定不变的情况下,自变量的暴露水平每改变一个测量单位时所引起的比数比的自然对数改变量。或者说,在其他自变量固定不变的情况下,当自变量的水平每增加一个测量单位时所引起的比数比为增加前的倍。同多元线性回归一样,在比较暴露因素对反应变量相对贡献的大小时,由于各自变量的取值单位不同,也不能用偏回归系数的大小作比较,而须用标准化偏回归系数来做比较。标准化偏回归系数值的大小,直接反映了其相应的暴露因素对应变量的相对贡献的大小。标准化偏回归系数的计算,可利用有关统计软件在计算机上解决。 (五)logistic回归参数估计 由于logistic回归是一种概率模型,通常用最大似然估计法(maximumlikelihoodestimate)求解模型中参数的估计值。 为在作用下的阳性事件(或疾病)发生的指示变量。其赋值为: 第个观察对象对似然函数的贡献量为: 当各事件是独立发生时,则个观察对象所构成的似然函数是每个观察对象的似然函数贡献量的乘积,即 式中∏为从1到的连乘积。 依最大似然估计法的原理,使得达到最大时的参数值即为所求的参数估计值,计算时通常是将该似然函数取自然对数(称为对数似然函数)后,用Newton—Raphson迭代算法求解参数估计值。 (六)logistic回归筛选自变量 在logistic回归中,筛选自变量的方法有似然比检验(likelihoodratiotest)、计分检验(scoretest)、Wald检验(Waldtest)三种。其中似然比检验较为常用, 用Λ表示似然比检验统计量,计算公式为: 式中为自然对数的符号,为方程中包含个自