预览加载中,请您耐心等待几秒...
1/6
2/6
3/6
4/6
5/6
6/6

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

用心爱心专心 统计案例复习教案 一、本章知识脉络: 统计案例 回归分析 样本点的中心 随机误差 残差分析 建立回归模型的基本步骤 回归分析 列联表 K2=eq\f(n(ad-bc)2,(a+b)(c+d)(a+c)(b+d)) 判断结论成立可能性的步骤 二、本章要点追踪: 1.样本点的中心(eq\O(x,\s\up8(-)),eq\O(y,\s\up8(-))) 其中eq\O(x,\s\up8(-))=eq\f(1,n)eq\s\di(n,∑,i=1)xi,eq\O(y,\s\up8(-))=eq\s\di(n,∑,i=1)yi. 2.线性回归模型的完美表达式 eq\b\lc\{(\a\vs2(y=bx+a+e,E(e)=0,D(e)=σ2)) 3.类比样本方差估计总体方差的思想,可以用 eq\O(σ2,\s\up8(∧))=eq\f(1,n-2)eq\s\di(n,∑,i=1)eq\O(e2,\s\up8(∧))i=eq\f(1,n-2)Q(eq\O(a,\s\up8(∧)),eq\O(b,\s\up8(∧)))(n>2) 作为σ2的估计量其中eq\O(a,\s\up8(∧))=eq\O(y,\s\up8(-))-eq\O(b,\s\up8(∧))eq\O(x,\s\up8(-)) eq\O(b,\s\up8(∧))=eq\f(eq\s\di(n,∑,i=1)(xi-eq\O(x,\s\up8(-)))(yi-eq\O(y,\s\up8(-))),eq\s\di(n,∑,i=1)(xi-eq\O(x,\s\up8(-)))2) 4.我们可以用相关指数R2来刻画回归的效果,其计算公式是: R2=1-eq\f(eq\s\di(n,∑,i=1)(yi-eq\O(yi,\s\up8(∧)))2,eq\s\di(n,∑,i=1)(yi-eq\O(yi,\s\up8(-)))2) R2取值越大,意味着残差平方和越小,也就是说模型的拟合效果越好. 5.建立回归模型的基本步骤: (1)确定研究对象,明确哪个变量是解释变量,哪个变量是预报变量; (2)画出确定好的解释变量和预报变量的散点图,观察它们之间的关系(如是否存在线性关系等); (3)由经验确定回归方程的类型(如我们观察到数据呈线性关系,则选用线性回归方程y=bx+x); (4)按一定规则估计回归方程中的参数(如最小二乘法); (5)得出结果后分析残差图是否有异常(个别数据对应残差过大,或残差呈现不随机的规律性等等),若存在异常,则检查数据是否有误,或模型是否合适等。 6.作K2来确定结论“X与Y有关系”的可信程度. 三、几个典型例题: 例1某地区10名健康儿童头发和全血中的硒含量(1000ppm)如下, 血硒74668869917366965873发硒13101311169714510(1)画出散点图; (2)求回归方程; (3)如果某名健康儿童的血硒含量为94(1000ppm)预测他的发硒含量. 解(1)散点图如下图所示: (2)利用计算器或计算机,求得回归方程: eq\O(y,\s\up8(∧))=0.2358x-6.9803 (3)当x=94时,eq\O(y,\s\up8(∧))≈15.2 因此,当儿童的血硒含量为94(1000ppm)时,该儿童的发硒含量约为15.2(1000ppm). 某地大气中氰化物测定结果如下: 污染源距离50100150200250300400500氰化物浓度0.6870.3980.2000.1210.090.050.020.01(1)试建立氰化物浓度与距离之间的回归方程. (2)求相关指数. (3)作出残差图,并求残差平方和 解析(1)选取污染源距离为变量x,氰化物浓度为自因变量y作散点图. 从表中所给的数据可以看出,氰化物浓度与距离有负的相关关系,用非线性回归方程来拟合,建立y关于x的指数回归方程. eq\O(y,\s\up8(∧))=0.9293e-0.0094x (2)相关指数K2=1-eq\f(eq\s\di(n,∑,i=1)(yi-eq\O(yi,\s\up8(∧)))2,eq\s\di(n,∑,i=1)(yi-eq\O(y,\s\up8(∧)))2)=0.9915 (3) 编号12345678污染源距离50100150200250300400500氰化物浓度0.6870.3980.20.1210.090.050.020.01残