预览加载中,请您耐心等待几秒...
1/6
2/6
3/6
4/6
5/6
6/6

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

万方数据 Logistic回归模型分析models施朝健L2,张明铭1AnalysisofLogisticregressionChaojMingming引言计算机辅助工程摘要:对Logistic回归模型做了比较详细的分析。通过阐述回归分析与概率假定的关系,并把回归模型纳入广义线性模型框架进行推导和分析,便于全面了解回归模型及其理论依据和构造方法,以利于对回归模型的合理应用。关键词:Logistic回归;广义线性模型;概率模型中图分类号:0212.1;TP274文献标识码:ASHI1一,ZHANGOLogistic回归分析作为一种有效的数据处理方法被广泛应用,尤其在医学、社会调查、生物信息处理等领域。在国内,对Logistic回归的研究主要集中在应用方面,但许多研究人员在应用Logistic回归算法时,很少仔细探究其背后的理论模型和有关假定,因而会出现应用不太合理的情况。例如,在利用Logistic回归研究影响初中学生开始吸烟的因素时,采用整群抽样的方法,在城市及郊区的学校各选择初一年级一个班的全部学生进行调查。川该方法没有考虑到学生之间的吸烟行为是互相影响的,即研究个体之间不是独立的。其合理性受到质疑。[2】也有少部分研究涉及Logistic回归模型的理论问题。文献【3】注意到Logistic回归模型中的过度离散现象,提出通过Pearson和Deviance统计量和利用Williams法进行纠正的方法。文献[4】对Logistic回归模型进行分析,应用Bayes观点讨论Logistic模型中的参数估计问题。近年来,Logistic回归的应用研究在继续拓展。国外开始进行将其应用于多实例标签包(1abeledinstances)分类问题的研究。【5】国内也开始注CoMPI,TER(1.上海海事大学商船学院,上海200135;2.复旦大学信息工程学院,上海200433)ian第14卷第3期2005年9月MarineMaritimemodelperformedframeworkmodels,amethodsmodels.Keymodel;probabilisticAIDEDENGINEERE呵GSep.2005文章编号:1006.0871(2005)03—0074.05(1.MerchantCollege,Shanghai200135,China;Univ.,Shanghai200433,China)Abstract:Logisticisanalyzedindetail.Byillustratingtherelationbetweenanalysisanditsprobabilityhypothesis,analyzingdeducingwhichgeneralizedlinearthoroughunderstandingtheoreticalbackgroundconstructioniSbenefitreasonableapplicationsthesewords:Logisticregression;generalizedbag收稿日期:2005—08一Ol;修回日期:2005—08-13基金项目:上海市重点学科建设项目(TtK503)作者简介:施朝健(1957一),男,福建屏南人,教授,博导,研究方向为交通信息工程及控制,①一mail)cjshi@shmtu.edu.ca、b1.14No.312.CollegeInf.Eng.,Fudantoare 万方数据 岫g彝赤唧(一学]:冉i=1志唧(一学]x惯{11y《]:扣击唧(一屿掣]砌㈨∥h,=志唧(-气竽]㈩‰(班咖’班嘉孵∞)=志唧卜譬j=舶g而1一≯1专I善n(y⋯一w7√f))2比)=专J(,.,):要∑n(y(i)--wTx(i))21线性回归的概率关联Logistic回归cost函数的分析:n(k(川)广’(1一k(n))¨⋯分布的假定。假设样本数对(一,Y‘o)间关系由如在£∽独立分布的假定下,给定z‘‘’的条件下尸独立L(_I.,)=兀P(Y‘。’∥’,’.,)给出表示X‘n,尸关系的概率模型,根据最大似然原施朝健,等:Logistic回归模型分析意应用累积Logistic回归尤其是多分类累积Logistic回归分析和处理的相关问题,但应用还是比较初步的,研究集中在对进行聚类分析后的离散性变量,利用线性系数模型进行累积Logistic回归。16’¨在现有的统计教科书中,一般都有Logistic回二归模型的内容,但往往不作为中心内容,缺乏有关该方法的详尽讨论。【8】机器学习的书籍虽然涉及到Logistic回归,但没有进行深入讨论。19】有关专著在国内外很少。因此有必要对该模型的理论背景和框架进行较为深入的探讨,以便做到合理应用该模型。利:用最小二乘法进行线性