预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10
亲,该文档总共37页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
如果您无法下载资料,请参考说明:
1、部分资料下载需要金币,请确保您的账户上有足够的金币
2、已购买过的文档,再次下载不重复扣费
3、资料包下载后请先用软件解压,在使用对应软件打开
二、自变数与依变数
对据有统计关系的两个变数,分别用变数符号Y和X表示。根据两个变数的作用特点,统计关系又可分为因果关系和相关关系两种。
两个变数间的关系若有原因和反应(结果)的性质,则称这两个变数间存在因果关系,并定义原因变数为自变数,以X表示;定义结果变数为依变数,以Y表示。如果两个变数并不是原因和结果的关系,是一种平行关系,呈现一种共同变化的特点,则称这两个变数间存在相关关系。如在人的身高和体重关系中,它们不是互为因果,而是同步增长、互有影响的。
相关关系中没有自变数和依变数之分。(1)对具有因果关系的两个变数,统计分析的任务是由实验数据推算出一个表示Y随X的改变而改变的方程,称之为回归方程(regressionequationofYonX),这一过程称为回归分析。
(2)对具有相关关系的两个变数,统计分析的目标是计算表示Y和X相关密切程度的统计数,并测验其显著性。这一过程称为相关分析。四、两个变数资料的散点图
将两个变数的n对观察值(x1,y1)、(x2,y2)、…、(xn,yn)分别以坐标点的形式标记于同一直角坐标平面上得到的图,称为散点图(scatterdiagram)。利用散点图判断相关性质及密切程度第二节直线回归分析从上图得知,要使能够最好地代表y和x在数量上的互变关系,必须使分别对a和b求偏导并令其为0,即:[例7.1]一些夏季害虫盛发期的早迟和春季温度高低有关。江苏武进连续9年测定3月下旬至4月中旬旬平均温度累积值(x,旬.度)和水稻一代三化螟盛发期(y,以5月10日为0)的关系,得结果于下表。试计算其直线回归方程。解:1.由观察值计算一级数据3.求a和b值当3月下旬至4月中旬的积温(x)每提高1旬·度时,一代三化螟的盛发期平均将提早1.1天;若积温为0,则一代三化螟的盛发期将在6月27—28日(x=0时,y=48.5;因y是以5月10日为0,故48.5为6月27—28日)。
但在应用回归方程预测时,需限定x的区间为[31.7,44.2];如要在x<31.7或>44.2的区间外延,则必须有新的依据。x,3月下旬至4月中旬旬平均温度累积值
旬平均温度累积值和一代三化螟盛发期的关系五、直线回归的估计标准误
满足为最小的直线回归方程和实测的观察点并不重合,表明该回归方程仍然存在随机误差。
Q就是误差的一种度量,称之为离回归平方和或剩余平方和。Q值的计算:(1)F测验/[例]试用F测验法检测7.1资料回归关系的显著性。(2)t测验
若总体不存在直线回归关系,则总体回归系数β=0;若总体存在直线回归关系,则总体回归系数β≠0。
所以对直线回归的假设测验为:
H0:β=0对HA:β≠0。
回归系数b的标准误为:[例]试测验7.1资料回归关系的显著性。第四节相关分析8.3.1相关系数和决定系数后者是由X的不同而引起。显然,若坐标点愈靠近回归线,则U对SSy的比率愈大,直线相关就愈密切,故样本的相关系数r为:二、决定系数
决定系数(determinationcoefficient):由x不同引起的y的平方和占总平方和的比率。/三、相关系数的性质r的绝对值表示相关的密切程度
r的绝对值越接近于1,相关越密切;
r的绝对值越接近于0,相关越不密切;
r的绝对值为0,零相关或不相关;
r的绝对值为1,完全相关
r=1,完全正相关
r=-1,完全负相关回归分析和相关分析的区别和联系:区别:联系:3.相关和回归可以互相解释。
当SS总不变的情况下,回归平方和的大小决定了相关系数的大小,r2则可以反映回归平方和在总平方和中所占的比重。回归平方和接近总平方和时,r2接近1,回归效果好。同时也可以从回归的角度对相关程度做进一步的解释。如r=0.5,r2=0.25,说明一个变量y的总变异能够通过x变量以直线回归的关系来估计的比重只占25%,其余75%的变异无法借助直线回归来估计,从而说明两变量间的相关关系实际意义不大。直线回归和相关的应用要点:4.一个显著的r或b并不代表X和Y的关系一定是线性的,并不排斥有更好描述X和Y关系曲线的存在。可能就某一区段来讲有极显著的直线关系。
5.在农学和生物研究过程中,发现X和Y关系真实曲线是很难的。只能就某一区段来研究。外推是危险的。
6.一个显著的相关或回归并不一定有实践上的预测意义,有时候不可靠。需要预测时,r的绝对值必须在0.7以上。
7.为了提高分析的准确性,两变数的样本容量n≥5.感谢您的观看!内容总结