预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共63页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第4讲变量间的相关关系、统计案例1.两个变量的线性相关(1)正相关在散点图中点散布在从__________到________的区域对于两个变量的这种相关关系我们将它称为正相关.(2)负相关在散点图中点散布在从_________到_________的区域两个变量的这种相关关系称为负相关.(3)线性相关关系、回归直线如果散点图中点的分布从整体上看大致在__________________就称这两个变量之间具有线性相关关系这条直线叫做回归直线.2.回归方程(1)最小二乘法求回归直线使得样本数据的点到它的__________________的方法叫做最小二乘法.3.回归分析(1)定义:对具有________________的两个变量进行统计分析的一种常用方法.(2)样本点的中心对于一组具有线性相关关系的数据(x1y1)(x2y2)…(xnyn)其中(xy)称为样本点的中心.(3)相关系数当r>0时表明两个变量_________________;当r<0时表明两个变量_____________.r的绝对值越接近于1表明两个变量的线性相关性_______.r的绝对值越接近于0表明两个变量之间_______________________.通常|r|大于________时认为两个变量有很强的线性相关性.4.独立性检验(1)分类变量:变量的不同“值”表示个体所属的___________像这类变量称为分类变量.(2)列联表:列出两个分类变量的__________称为列联表.假设有两个分类变量X和Y它们的可能取值分别为{x1x2}和{y1y2}其样本频数列联表(称为2×2列联表)为2×2列联表(3)独立性检验利用随机变量_______来判断“两个分类变量_______”的方法称为独立性检验.题组一常识题1.(教材改编)已知具有线性相关关系的两个变量xy之间的一组数据如下:【答案】6.72.(教材改编)利用独立性检验来判断两个分类变量X和Y是否有关系通过查阅下表来确定“X和Y有关系”的可信度.为了调查用电脑时间与视力下降是否有关系现从某地居民中抽取100位居民进行调查.经过计算得K2≈3.855那么就有__________%的把握认为用电脑时间与视力下降有关系.P(K2≥k0)【解析】根据表格发现3.855>3.8413.841对应的是0.05所以根据独立性检验原理可知有95%的把握认为用电脑时间与视力下降有关系.【答案】95题组二常错题◆索引:易混淆相关关系与函数关系;误认为样本点必在回归直线上;利用回归方程分析问题时误认为所得的数据是准确值;在独立性检验中有关系并不等于绝对发生.3.在一次对人体脂肪含量和年龄关系的研究中研究人员获得了一组样本数据并制成如图所示的人体脂肪含量与年龄关系的散点图下列结论中正确的是____________.(填序号)①人体脂肪含量与年龄正相关且脂肪含量的中位数等于20%;②人体脂肪含量与年龄正相关且脂肪含量的中位数小于20%;③人体脂肪含量与年龄负相关且脂肪含量的中位数等于20%;④人体脂肪含量与年龄负相关且脂肪含量的中位数小于20%.【解析】散点图呈现上升趋势故人体脂肪含量与年龄正相关.因为中间两个数据介于15%到20%之间所以脂肪含量的中位数小于20%.【答案】②①y与x呈正相关;②回归直线过样本点的中心(xy);③若该大学某女生的身高增加1cm则其体重约增加0.85kg;④若该大学某女生身高为170cm则可断定其体重必为58.79kg.5.对长期吸烟与患肺癌这两个分类变量的计算中得出K2的值大于3.841且查表可知P(K2≥3.841)≈0.05则下列说法正确的是________.(填序号)①我们有95%的把握认为“长期吸烟与患肺癌有关系”那么在100个长期吸烟的人中必有95人患肺癌;②从独立性检验的原理可知有95%的把握认为“长期吸烟与患肺癌有关系”即某一个人如果长期吸烟那么他有95%的可能患肺癌;③从独立性检验的原理可知有超过95%的把握认为“长期吸烟与患肺癌有关系”是指有不超过5%的可能性使得推断出现错误;④以上三种说法都不正确.【解析】对于①我们有95%的把握认为“长期吸烟与患肺癌有关系”不能代表在100个长期吸烟的人中必有95人患肺癌①错误;对于②不能确定某一个人如果长期吸烟那么他有95%的可能患肺癌②错误;对于③我们有95%的把握认为“长期吸烟与患肺癌有关系”即指有不超过5%的可能性使得推断出现错误③正确;易知④错误.【答案】③(2)对四组数据进行统计获得如图所示的散点图关于其相关系数的比较正确的是()A.r2<r4<0<r3<r1B.r4<r2<0<r1<r3C.r4<r2<0<r3<r1D.r2<r4<0<r1<r3【反思归纳】跟踪训练1下列四个散点图中变量