预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共65页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第三军医大学军事预防医学院卫生统计学教研室DepartmentofHealthstatistics,TMMU Tel:6875234313996478364 授课对象:2010级研究生任课教员:张彦琦讲师第十六章 Logistic回归分析 LogisticRegressionAnalysis第一节非条件Logistic回归分析几个重要的流行病学概念几个重要的流行病学概念队列研究病例对照研究危险度相对危险度相对危险度比数(odds):发生率与未发生率之比,即p/(1-p),即阳性率/阴性率。 比数比(oddsratio,OR):两个比数之比, 即,通常在流行病研究中 p1为病例组的暴露率,p2为对照组的暴露率。比数比一个病例对照研究资料目的:作出以多个自变量(危险因素)估计应变量(结果因素)的logistic回归方程。属于概率型非线性回归。 资料:1.应变量为反映某现象发生与不发生的二值变量; 2.自变量宜全部或大部分为分类变量,可有少数数值变量。分类变量要数量化。用途:研究某种疾病或现象发生和多个危险因素(或保护因子)的数量关系。 用检验(或u检验)的局限性: 1.只能研究1个危险因素; 2.只能得出定性结论。 种类: 1.成组(非条件)logistic回归方程。 2.配对(条件)logistic回归方程。第一节Logistic回归分析LogisticRegression实例例16-2为了探讨冠心病发生的有关危险因素,对26例冠心病病人和28例对照者进行病例对照研究,调查记录了8个可能的危险因素,试用Logistic逐步回归分析方法筛选危险因素,并分析各自变量的作用大小。表16-2冠心病8个可能的危险因素与编码说明Logistic回归模型Logistic回归模型Logistic曲线常数项:α表示暴露剂量为0时个体发病与不发病概率之比的自然对数。 回归系数:表示自变量改变一个单位时Logit(P)的改变量。流行病学衡量危险因素作用大小的比数比指标。计算公式为:模型参数的意义模型参数的意义模型参数的意义logistic回归模型的参数估计logistic回归模型的假设检验标准化回归系数实例分析数据准备成3列:例数、吸烟史(1:有,0:无),膀胱癌(1:有,0:无)Data WeightcasesAnalyze Regression BinaryLogistic应变量编码方法:前进法、后退法和逐步法。检验统计量:不是F统计量,而是似然比统计量、Wald统计量和计分统计量之一。变量的筛选表16-2冠心病8个可能的危险因素与编码说明实例分析由标准化回归系数可以看出,选入的四个危险因素按其影响大小排列的顺序为X6、X8、X5、X1,它们分别是动物脂肪摄入量、A型性格、高血脂史和年龄增高。第二节条件Logistic回归分析ConditionalLogisticRegression条件Logistic回归的原理表16-51:M条件logistic回归数据的格式条件Logistic回归模型实例分析数据准备成4列:X1、X2、X3,配对号及疾病发生情况Y(1:病例,0:对照)。模型拟合结果实例分析第三节Logistic回归的应用及注意事项logistic回归分析的特点之一是参数意义清楚,即得到某一因素的回归系数后,可以很快估计出这一因素在不同水平下的优势比OR或近似相对危险度RR,因此非常适合于流行病学研究。 logistic回归既适合于队列研究(cohortstudy),也适合于病例-对照研究(case-controlstudy),同样还可以用于横断面研究(cross-sectionalstudy)临床试验的目的大多是为了评价某种药物或治疗方法的效果,如果有其他影响效果的非处理因素(如年龄、病情等)在试验组和对照组中分布不均衡,就有可能夸大或掩盖试验组的治疗效果。 当非处理因素过多时,可能会遇到各层样本量过小和非处理因素在试验组和对照组内的分布不均衡的问题。用单因素分析很难保证对比组间的齐同性。 当评价指标为二值变量时(如有效和无效),可以利用logistic回归分析得到调整后的药物评价结果。在一些药物或毒物效价的剂量-反应实验研究中,每一只动物药物耐受量可能有很大的不同,不同剂量使动物发生“阳性反应”的概率分布常呈正偏态,将剂量取对数后则概率分布接近正态分布。由于正态分布函数与logistic分布函数十分接近,如果用P表示在剂量为X时的阳性率,可用下述模型表示它们之间的关系 logistic回归是一个概率型模型,因此可以利用它预测某事件发生的概率。例如在临床上可以根据患者的一些检查指标,判断患某种疾病的概率有多大。Logistic回归的样本量logistic回归变量的数量化βj的值并不具有OR或RR的直接含义,它只是OR或RR的自然对数值。