预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共56页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

内容提要对分类变量的分析,当考察的影响因素较少,且也为分类变量时,常用列联表(ContingencyTable)进行整理,并用2检验或分层2检验进行分析,但存在以下局限性:无法描述其作用大小和方向,更不能考察各因素间是否有交互作用;当控制的分层因素较多时,将导致检验结果不可靠;2检验无法对连续性自变量进行分析(致命缺陷)。logistic回归模型适合于应变量为二项分类的资料,在医学研究领域中的应用广泛。如流行病病因学研究(包括队列研究、病例对照研究、横断面研究等)、临床疗效研究(如疗效与治疗方法、患病轻中重等因素关系)、卫生服务研究(如是否就诊与性别、年龄、文化程度的关系)等等。模型简介反应变量为二分类变量或某事件的发生率;自变量与logit(P)之间为线性关系;残差合计为0,且服从二项分布;各观测间相互独立。例1某医师希望研究病人的年龄age、性别sex(0为女性、1为男性)、心电图检验是否异常ecg(ST段压低、0为正常、1为轻度异常、2为重度异常)与冠心病ca是否有关,数据见logistic_binary.sav。简单分析实例简单分析实例简单分析实例哑变量设置例2Hosmer和Lemeshow于1989年研究了低出生体重婴儿的影响因素,结果变量为是否娩出低出生体重儿(变量名为LOW,1表示低出生体重儿,0表示非低出生体重儿),考虑的自变量有产妇妊娠前体重、产妇年龄、种族、是否吸烟、早产次数、是否患高血压等。(数据文件见:logistic_step.sav。)哑变量设置选入无序多分类变量哑变量设置参照水平最好要有实际意义,不推荐使用其他作为参照;参照水平组要有一定的频数作保证,应不少于30或50例;对有序自变量的分析:从专业出发确定;分别以哑变量和连续性变量的方式引入模型进行比较后确定。Forward:Conditional(最可靠)Forward:LRForward:Wald(应当慎用)Backward:Conditional(最可靠)Backward:LRBackward:Wald(应当慎用)例3仍以例2的数据为例,演示如何在SPSS中实现逐步logistic回归分析。选择其中一种逐步法逐步回归逐步回归逐步回归对数似然值与伪决定系数模型预测正确率ROC曲线对数似然值与伪决定系数:-2倍对数似然值表示模型的拟合效果,其值越小,越接近于0,说明模型拟合效果越好。但是,当自变量中存在缺失值时,因为一般统计软件在进行计算时会把含有缺失值的记录予以剔除,不参与统计分析,此时不能用-2loglikelihood对不同模型的拟合效果进行比较。模型预测正确率:ROC曲线:模型拟合效果检验模型拟合优度检验(TestofGoodnessFit):考察当前模型是否可以进一步改善,检验当前模型与饱和模型的预测效果之差是否有统计学意义。Pearson和Deviance拟合优度检验:当自变量很多,或包含连续性自变量时,不可以用这两种方法。似然比检验:主要用于考察饱和模型是否可以进一步简化。Hosmer-Lemeshow检验:通常用于自变量很多,或包含连续性自变量的情况。拟合优度检验多重共线性的对偏回归系数的影响与线性回归模型中的表现一致,如增加或删除一条记录,模型中偏回归系数值发生较大变化,专业上认为有意义的因素无统计学意义等等。如果在进行logistic模型分析中,尤其是在向模型中引入交互作用项时出现了回归结果反常现象,则自变量之间的多重共线性是需要排除的一种可能。目前SPSS的logistic过程中尚没有关于多重共线性诊断的结果输出,代替方法之一是运用相同的反应变量与自变量,拟合线性回归模型,并进行相应的共线性诊断。匹配设计(matcheddesign)是在设计阶段控制混杂因素的一种方法。当得到一名研究病例后,选择一名或多名非病例作为对照,选择相应对照的条件是:某些需要控制的混杂因素与该病例之间相同或相似,从而形成一个匹配的对子。一个匹配的对子可以只有1个病例和1个对照,称1:1匹配;当病例很罕见时,常采用1个病例,多个对照,此时称为1:m匹配,常用的m一般小于等于4,不同的对子,m可以不同;还可设计m:n匹配,即不同对子的病例与对照个数均可不同,这样的设计增加了收集资料的灵活性。对于这类匹配设计资料,如果采用以上介绍的非条件logistic回归方法,将会降低检验效能。而应当采用条件logistic回归模型(conditionallogisticregressionmodel)又称配对logistic回归模型进行分析。用变量差值拟合:只适用于1:1配对的情况,用Multinomiallogistic过程实现;用分层Cox模型拟合:适用范围非常广。例4Mack等人预考察服用雌激素与患子宫内膜癌的关系,对退休居住在社区的妇女进行病例对照研究