预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共61页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

直线回归与相关知识最高月产、变量间的关系有两类: 一类是变量间存在着完全确定性的关系,可以用精确的数学表达式来表示。 如长方形的面积(S)与长(a)和宽(b)的关系可以表达为:S=ab。它们之间的关系是确定性的,只要知道了其中两个变量的值就可以精确地计算出另一个变量的值,这类变量间的关系称为函数关系。另一类是变量间不存在完全的确定性关系,不能用精确的数学公式来表示。 如黄牛的体长与体重的关系;仔猪初生重与断奶重的关系;猪瘦肉率与背膘厚度、眼肌面积、胴体长等的关系等等,这些变量间都存在着十分密切的关系,但不能由一个或几个变量的值精确地求出另一个变量的值。像这样一类关系在生物界中是大量存在的,统计学中把这些变量间的关系称为相关关系,把存在相关关系的变量称为相关变量。相关变量间的关系一般分为两种: 一种是因果关系,即一个变量的变化受另一个或几个变量的影响。如仔猪的生长速度受遗传特性、营养水平、饲养管理条件等因素的影响,子代的体高受亲本体高的影响; 另一种是平行关系,它们互为因果或共同受到另外因素的影响。如黄牛的体长和胸围之间的关系,猪的背膘厚度和眼肌面积之间的关系等都属于平行关系。统计学上采用回归分析(regressionanalysis)研究呈因果关系的相关变量间的关系。表示原因的变量称为自变量,表示结果的变量称为依变量。 研究“一因一果”,即一个自变量与一个依变量的回归分析称为一元回归分析; 研究“多因一果”,即多个自变量与一个依变量的回归分析称为多元回归分析。 一元回归分析又分为直线回归分析与曲线回归分析两种;多元回归分析又分为多元线性回归分析与多元非线性回归分析两种。回归分析的任务是揭示出呈因果关系的相关变量间的联系形式,建立它们之间的回归方程,利用所建立的回归方程,由自变量(原因)来预测、控制依变量(结果)。 统计学上采用相关分析(correlationanalysis)研究呈平行关系的相关变量之间的关系。 对两个变量间的直线关系进行相关分析称为简单相关分析(也叫直线相关分析); 对多个变量进行相关分析时,研究一个变量与多个变量间的线性相关称为复相关分析;研究其余变量保持不变的情况下两个变量间的线性相关称为偏相关分析。 第一节直线回归从散点图(图8-1)可以看出: ②两个变量间直线关系的性质(是正相关还是负相关)和程度(是相关密切还是不密切);如果呈因果关系的两个相关变量y(依变量)与x(自变量)间的关系是直线关系,根据n对观测值所描出的散点图,如图8—1(b)和图8—1(e)所示。 其中: x为可以观测的一般变量(也可以是可以观测的随机变量); y为可以观测的随机变量; 这就是直线回归的数学模型。我们可以根据实际观测值对α,β以及方差做出估计。在x、y直角坐标平面上可以作出无数条直线,我们把所有直线中最接近散点图中全部散点的直线用来表示x与y的直线关系,这条直线称为回归直线。 其中,a是α的估计值,b是β的估计值。 a、b应使回归估计值与实际观测值y的偏差平方和最小,即: 整理得关于a、b的正规方程组: (8-3)式中的分子是自变量x的离均差与依变量y的离均差的乘积和,简称乘积和,记作,分母是自变量x的离均差平方和,记作SSX。 a叫做样本回归截距,是回归直线与 y轴交点的纵坐标,当x=0时,=a; 回归方程的基本性质: 如果将(8-4)式代入(8-2)式,得到回归方程的另一种形式(中心化形式): 【例8.1】在四川白鹅的生产性能研究中,得到如下一组关于雏鹅重(g)与70日龄重(g)的数据,试建立70日龄重(y)与雏鹅重(x)的直线回归方程。表8-1四川白鹅雏鹅重与70日龄重测定结果 (单位:g)1、作散点图以雏鹅重(x)为横坐标,70日龄重(y)为纵坐标作散点图,见图8-3。 2、计算回归截距a,回归系数b,建立直线回归方程 首先根据实际观测值计算出下列数据: 进而计算出b、a: 根据直线回归方程可作出回归直线,见图8-3。从图8-3看出,并不是所有的散点都恰好落在回归直线上,这说明用去估计y是有偏差的。3、直线回归的偏离度估计 偏差平方和的大小表示了实测点与回归直线偏离的程度,因而偏差平方和又称为离回归平方和。统计学已经证明:在直线回归分析中离回归平方和的自由度为n-2。于是可求得离回归均方为: 离回归均方是模型(8-1)中σ2的估计值。 离回归均方的平方根叫离回归标准误,记为,即 (8-6) 离回归标准误Syx的大小表示了回归直线与实测点偏差的程度,即回归估测值与实际观测值y偏差的程度,于是我们把离回归标准误Syx用来表示回归方程的偏离度。 以后我们将证明: (8-7) 利用(8-7)式先计算出,然后再代入(8-6)式求Syx。 二、直线回归的显著性检验 若