预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

LOGISTIC回归 二、Logit回归模型 除这三个特殊点之外,还应有一个自然的要求,就是的极限存在,至少随的增加而变化的速率应该越来越慢,而不能象线性模型那样直来直去成比例增长。以住房——收入模型而言, 当收入为10时,有住房的可能性是0.0607;当收入提高到20时,有住房的可能性为1.1087,已超过100%;当收入为30时,则为2.1567,等等。显然,这个模型需要改进。 o X 1 图A 改进的目标可以用图A表示。 如果有一个这样的模型函数,则它满足,同时变化速率在起始阶段比较慢,中期越来越快,到后期又越来越缓,比较符合实际。 怎样找到这样一个函数呢? 函数 具有此性质 原来是 如果改进为 则,并且在时变化越来越缓。记,则 这就得到了我们需要的Logit模型函数,原来是对它取了对数,故名Logit。这个函数不是与呈线性关系,而是与呈线性关系。当时,。与的关系曲线正是上图表示的形曲线。将自变量扩充为多元,加上随机项,就得到一般的Logit回归模型: 如果我们从这个模型中得到的估计,就可以估计出第个样本有(或无)的可能性。 但是又产生一个新问题,我们如何得到呢?如果从原来的二值选择数据出发,我们连回归模型都建立不起来。因为二值选择或,无法取对数。 原来数据是从纯粹的个体出发的。我们可以改从小范围的个体出发建立数据,即将自变量按某些值分成若干组。比如分成组。每组里有个样品,取有时是个,则取无时是个,于是 以这样的数据可以代入Logit回归模型。 例1 Thedata,takenfromCoxandSnell(1989,pp.10–11),consistofthenumber,r,ofingotsnotreadyforrolling,outofntested,foranumberofcombinationsofheatingtimeandsoaking time. dataingots; inputHeatSoakrn@@; datalines; 71.0010141.0031271.0156511.0313 71.7017141.7043271.7444511.701 72.207142.2233272.2021512.201 72.8012142.8031272.8122514.001 74.009144.0019274.0116 ; proclogisticdata=ingots; modelr/n=HeatSoak; run; 分析两个因素heat,soak影响铸铁成功 加执时间Heat浸处理时间Soak没准备好的次数(失败次数)r试验次数n7101014103127115651131371.7017141.7043271.7444511.70172.207142.2233272.2021512.20172.8012142.8031272.8122514017409144019274116 HeatSoakNotReadyFreq71010141031144019272.20215111371.7017141.704327111272.81151101072.207142.212271055272.8021511.70172.8012142.2031271.71427411512.2017409142.8031271.704027401551401 dataingots; inputHeatSoakNotReadyFreq@@; datalines; 71.0010141.0031144.0019272.2021511.013 71.7017141.7043271.011272.811511.0010 72.207142.212271.0055272.8021511.701 72.8012142.2031271.714274.011512.201 74.009142.8031271.7040274.0015514.001 ; proclogisticdata=ingotsdescending; modelNotReady=SoakHeat; freqFreq; run; 例 研究癌免疫(remiss=1有免疫,,因素变量六个,细胞cell,smearinfilliblasttemp remisscellsmearinfilliblasttemp10.80.830.661.91.10.99610.90.360.321.40.740.99200.80.880.70.80.1760.982010.870.870.71.0530.98610.90.750.681.30