预览加载中,请您耐心等待几秒...
1/4
2/4
3/4
4/4

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

JournalofMathematicalMedicineVo1.16NO.22003 文章编号:1004—4337(2003)02—0140—04中图分类号:R195.1文献标识码:A 主成分回归分析与多元线性回归的对比研究 罗文海万巧云高永 (滨州医学院滨州256603) 摘要,为探讨医学本科生毕业成绩的影响因素.以105例医学本科毕业生的19fl主要课程成绩作为自变量。以其毕生成绩作 为因变量。进行了多元线性回归分析和主成分回归分析. 关键词:主成分回归;多重共线性 在医学资料的多变量数据分析中,经常采用多元线性回行逐步回归分析,选人和剔除变量的概率水准均取默认值,分 归分析方法。采用这种方法分析得到的结果,在多数情况下比别为o.05、o.1O,所得结果见表2、3。 较合理,即自变量与因变量的关系与现代医学理论相吻合。然 表1医学生19门课程及毕业成绩(,I=105) 而我们遇到的资料在采用多元线性回归分析时得到的结果却 并不令人满意,即自变量与因变量的关系与现代医学理论相 违背,致使多元线性回归分析得到的结果无法用现代医学理 论进行解释,因而此时多元线性回归分析的结果难以被采用。 多元线性回归分析结果的这种不合理性可以用主成分回归分 析方法加以校正C1]。医学本科生的毕业成绩是对学生所学的 主要课程的熟练程度和综合应用能力的综合测评,是反映学 生素质和能力的重要测度。深入研究医学本科生毕业成绩的 影响因素.对于加强教学管理和提高学生的学习效果具有重 要意义。 1资料与方法 本文资料来自我院两个班的学生档案记录,随机抽取其表2多元线性回归方程的方差分析 中105例的数据进行分析。由于所学课程的数目较多,故只选 取其中主要的课程成绩19门作为自变量。用毕业成绩作为因 变量。用SPSS统计分析软件进行数据录入和分析。少数学生 的个别课程的成绩为补考6O分,因其与非补考6O分不同,故数 据录入前将其剔除。由于最初多元线性回归分析的部分结果 不合理.难以用现有的医学理论进行解释,故再使用主成分分由表2可见,多元回归方程的假设检验,P<0.001.故拒绝 析、变量转换和主成分回归分析等方法。最终的分析结果符合各均为O的假设,可以认为部分自变量对因变量毕业成绩 现有医学理论的解释,多元线性回归和主成分回归分析中均的影响有统计学意义。 由表3可见,卫生学、神经科、妇产科和内科成绩4个自变 使用逐步法进行处理。 量对毕业成绩因变量的作用均有显著性(P<O.01).其它15N 2结果 课程成绩对因变量作用均无显著性(P>0.05)。其中卫生学、 表1为105例医学本科生19N课程考试成绩及毕业成绩的神经科和妇产科成绩的偏回归系数为正值.其与因变量为正 均数和标准差。向变化关系,这符合实际情况。但内科成绩的偏回归系数为负 2.1多元线性回归分析值,其与因变量为负向变化关系,这有悖常理.可能是由于自 以19门课程成绩作为自变量,以毕业成绩作为因变量进变量共线性的影响,进一步作共线性诊断分析.其结果见表4。 ·140· 数理医药学杂志2003年第16卷第2期 裹3多元线性回归参数估计及其共线性统计■ 大时,表示共线性强。当条件数大于3O时,表示有高度共线性。 裹4多元线性回归自变■共线性诊断统计■ 由表4可见,维数随特征值变化,条件数也随特征值变化.第二 维数行中的条件数为28.243,接近3O,第3、第4和第5维数行中 的条件数均大于3O,这些指标数据均表示自变量共线性关系 严重。同一维数行中自变量方差比较大者表示其共线性较重。 2.2主成分回归分析 对多元线性回归分析中有显著性的4个自变量卫生学、神 经科、妇产科和内科进行主成分分析,采用默认的不旋转 计算方法。选取主成分的个数为4,其分析的结果见表5. 表4中的维数与特征值的大小有关,当特征值小和条件数 裹5不旋转时主成分分析的结果 表5中主成分个数的选取通常以累计方差百分比大于主成分回归方程,再将表5中的主成分代入该标化主成分回归 85%为准。由表5-.3"见,本资料选取3个主成分才能使累计方差方程后,经整理得到的一般多元线性回归方程为。 百分比大于85。表5中自变量系数用于确定主成分,如第一y=一60.018+0.418卫生学+0.196内科+0.449神经科 个主成分为0.710卫生学+0.789内科+0.613神经科+0.659+0.527妇产科 妇产科。分别对上述4个自变量和因变量毕业成绩进行标准虽然上述一般多元线性回归方程中的卫生学、内科、神经 化,然后用于主成分回归分析。主成分回归分析的结果见表6。科和妇产科成绩的回归系数均为正值,这与医学理论相吻合, 纠正了表3中的内科成绩的回归系数为负值的不合理情况。但 裹6未旋转时主尬