预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共104页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

医学数据挖掘预测型知识例1从某单位1999年的职工体检资料中获得101名正常成年女子的血清总胆固醇(mmol/L)的测量结果例表212只大白鼠的进食量与体重增加量预测型知识预测型知识的挖掘挖掘预测型知识目的:作出以多个自变量估计应变量的多元线性回归方程。资料:应变量为定量指标;自变量全部或大部分为定量指标,若有少量定性或等级指标需作转换。用途:解释和预报。意义:由于事物间的联系常常是多方面的,一个应变量的变化可能受到其它多个自变量的影响,如糖尿病人的血糖变化可能受胰岛素、糖化血红蛋白、血清总胆固醇、甘油三脂等多种生化指标的影响。表1多元线性回归分析的数据结构实验对象yX1X2X3….XP1y1a11a12a13…a1p2y2a21a22a23…a2p3y3a31a32a33…a3p…………………nynan1an2an3…anp━━━━━━━━━━━━━━━━━━其中:y取值是服从正态分布表27名糖尿病人的血糖及有关变量的测量结果缺失值及处理线性回归直线回归方程的一般表达式X回归直线的特性直线回归的统计推断应用条件(line):线性(linear)独立性(independence)残差e服从正态分布(0,)(normality)等方差性(equityofvariance)非线性处理:结合专业知识,考虑回归方程中加入变量多次方项。Ŷ=a1+b1x1+b2x12对变量数据进行转换对数变换、log变换22Matlab实现线性回归表27名糖尿病人的血糖及有关变量的测量结果Matlab实现线性回归Matlab实现线性回归挖掘预测型知识Cox比例风险回归模型生存数据随访的方式随访的方式Cox比例风险回归模型Cox回归模型的应用条件Cox比例风险回归模型设不存在因素X1、X2、Xp的影响下,病人t时刻死亡的风险率为h0(t),存在因素X1、X2、Xpt的影响下,t时刻死亡的风险率为h(t)。Cox比例风险回归模型Cox比例风险回归模型风险函数(风险率)表示所有协变量Xi均为0时的危险率,一般是未知的。基础风险率是未知数,但它和风险函数呈比例。H0(t)与时间有关的任意函数,其分布和形状无明确的假定,是非参数的部分。Cox回归模型的检验Cox模型中回归系数的检验因素的筛选和最佳模型的建立相对危险度变量xj暴露水平时的风险率与非暴露水平时的风险率之比称为风险比HR(hazardratio)hr=eβiCOX回归的应用Matlab实现cox回归Matlab实现cox回归Matlab实现cox回归生存分析总流程几个率概念生存概率、生存率生存率(survivalrate)例:某病病人术后生存率生存曲线生存曲线生存率的估计方法乘积极限法(Product-LimitMethod)寿命表法(LifeTableMethod)寿命表法估计生存率步骤如下:1.将观察例数按时间段(年)0-,1-,2-,划分,分别计数期初例数,死亡,失访,截尾例数列入表22.2的1-5列。事实上,从第二个时间段开始,期初人数ni系由下式算得:n'i=n'i-1-di-ui-wi例如第二行,即时间段1-,有n'2=126-47-4-15=602.计算各时间段期初实际观察例数,(亦称有效例数)nini=n'i-ui/2-wi/2上式表明该时间段期初例数中的失访,及截尾例数只计其半时,即得有效例数。如第一行,n1=126-4/2-15/2=116.53.分别用(22.5)(22.6)(22.7)式计算条件生存率^S(ti/ti-1),累积生存率s(ti)及其标准误。计算结果已列于表22.2中,第7,8,11列,表中9,10二列系用于第11列的计算。例如时间段0--中^S(ti/ti-1)=(116.5-47)/116.5=0.5966^S(ti)=1×0.5966=0.5966SE(S(ti))=0.5966×√5.805×10-3=0.0455故一年生存率的估计为0.5966±0.0455同样二年生存率的估计为0.5386±0.0479由于寿命表法与积限法的累积生存率及其标准误的计算公式完全相同,所以,当分组资料中每一个分组区间中最多只有1个观察值时,寿命表法就是积限法。性别做生存分析第三节生存曲线的统计检验74Logrank检验(LogRankTest)Matlab实现性别做生存分析Matlab实现年龄做风险因素IDH突变生存分析挖掘预测型知识logistic回归模型数据结构logit变换优势比(oddsratio,OR)91优势比(oddsratio,OR)logistic回归模型的参数估计logistic回归模型的假设检验logistic回归的应用98Matlab实现例题