预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共56页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

本章重点客观世界中的种种现象可分为确定性现象和非确定性现象两类。就两个变量而言,如果对一个变量的每个可能取值,另一个变量都有完全确定的值与之对应,则称这两个变量之间的关系呈现函数关系。(圆周长=2r)在生物医学研究中,变量之间的关系多不是确定的,表现为具有随机性的一种“趋势”,也即自变量(independentvariable)取不同数值时,应变量(dependentvariable)可以是不同的取值,而且某值的出现完全是随机的。但是对应Xi在一定范围内的不同取值,应变量Y随X的变化呈现一定的趋势。人的身高与体重、收缩压与年龄之间的关系,一般说来,身高愈高的人,体重也重一些;年龄愈长者,收缩压也越高,从总体上看,都有某变量随另一变量变化的趋势。但这种关系显然不是函数关系。相关与回归分析就是研究两变量之间非确定性关系的一种统计方法。一、线性相关的基本概念直线相关是研究两变量x、y之间协同变化的数量关系的分析方法。为了研究父亲与成年儿子身高之间的关系,卡尔.皮尔逊测量了1078对父子的身高。把1078对数字表示在坐标上,如图。用水平轴X上的数代表父亲身高,垂直轴Y上的数代表儿子的身高,1078个点所形成的图形是一个散点图。它的形状象一块橄榄状的云,中间的点密集,边沿的点稀少,其主要部分是一个椭圆。体重(kg),x二、相关系数意义:描述两个变量直线相关的方向与密切程度的指标。表示方法:-1r1计算方法:编号身高(cm)前臂长(cm)XYX2Y2XY(1)(2)(3)(4)(5)(6)1170477990289002209217342726629929176431604470402560019364155416355240251681............11166443174285612116合计1891500861853260812281011名男青年身高与前臂长散点图本例:三、相关系数的假设检验目的:检验r是否来自总体相关系数=0的总体,从而推断两变量的相关关系是否成立。常用t检验。公式:相关系数的假设检验步骤:四、线性相关分析时的注意事项第二节直线回归例如:前例已知儿子的身高与父亲的身高有相关关系,能否通过父亲的身高估计儿子的身高呢?由于相关关系具有不确定性,不能用数学上的函数关系来描述。回归是一种研究两变量之间非确定性数量依存关系的统计方法。直线回归(linearregression)是找出一个直线方程来反映这种数量依存关系。一、直线回归的概念:直线回归是分析两变量间线性依存变化的数量关系。对资料的要求:自变量x为正态总体中的随机变量或指定变量,应变量y是服从正态分布的随机变量。二、直线回归方程的表达式及计算a为回归直线在y轴上的截距b为回归系数,即回归直线的斜率a和b的估计采用最小二乘法原则,即保证各实测点至回归直线的纵向距离平方和为最小。b为回归系数,直线的斜率(slope)。表示自变量X每改变一个单位,应变量Y平均变动的单位数。b>0,回归直线从左下方走向右上方,即因变量Y随X的增加而增加;b<0,回归直线从左上方走向右下方,即因变量Y随X的增加而减少;b=0,回归直线平行于X轴,即Y与X无统一线性依存关系。a为回归直线在Y轴上的截距(intercept)a>0,表示直线与Y交点在原点上方a<0,表示直线与Y交点在原点下方a=0,表示直线通过原点温度(oC)与蛙的心率(次/分)2.计算回归系数及常数项:3.建立回归方程:4.作回归直线三、回归系数的假设检验前面所求得的回归方程是由样本的信息所计算,抽样误差在所难免,必须对其进行假设检验。我们知道,即使X、Y的总体回归系数β为零,由于抽样误差的存在,其样本回归系数b也不一定为零。因此需作β是否为零的假设检验,可用方差分析或t检验。目的:推断总体回归系数是否为0,确定所求得的回归方程是否成立。假设:H0:=0H1:≠0=0.05对于任一x和y,有:因此,Y的总变异及其自由度分别分解为SS总=SS回+SS剩余υ总=υ回+υ剩余按照方差分析的思想,构造检验统计量1.建立检验假设:H0:β=0H1:β≠0α=0.052.计算统计量3.结论查F界值表,υ回归=1,υ剩余=9,F0.01(1,9)=10.56P<0.01,拒绝H0,接受H1,可认为温度与蛙的心率之间存在线性回归关系。(二)t检验本例:四、应用直线回归方程应注意的问题作回归分析要有实际意义;作回归分析时,如果两变量间是依存因果关系,则“因”变量为x,“果”变量为y;若无因果关系,则以易于测量和较稳定的变量为X。回归分析中,应变量是随机变量,自变量可以是随机变量(Ⅱ型回归模型),也可以是给定的量(Ⅰ型回归模型)。凡随机变量均要求服从正态分布。经检验拒绝了无效假设的回归方程才有意义。直线回归方程的适用范围一