预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共89页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第三章区间估计与假设检验3.1区间估计与假设检验的基本概念 3.1.1区间估计 3.1.2假设检验3.1.1区间估计 1.点估计和区间估计 参数的估计方法主要有两种:点估计和区间估计。 点估计是用样本的观测值估计总体未知参数的值。由于样本的随机性,不同样本观测值计算得出的参数的估计值间存在着差异,因此常用一个区间估计总体的参数,并把具有一定可靠性和精度的估计区间称为置信区间。利用构造的统计量及样本观测值,计算得出参数的置信区间的方法称为参数的区间估计。2.参数的置信区间 在区间估计中,对于总体的未知参数θ,需要求出两个统计量θ1(X1,X2,...,Xn)和θ2(X1,X2,...,Xn)来分别估计总体参数θ的上限和下限,使得总体参数在区间(θ1,θ2)内的概率为 P{θ1<θ<θ2}=1–α 其中1–α称为置信水平,而(θ1,θ2)称为θ的置信区间,θ1,θ2分别称为置信下限和置信上限。置信水平为1–α的含义是随机区间(θ1,θ2)以1–α的概率包含了参数θ。3.正态总体均值和方差的置信区间 参数的区间估计大多是对正态总体的参数进行估计,如对单总体均值、方差的估计、两总体均值差的估计和两总体方差比的估计等。 正态总体参数的各种置信区间见表3-1。正态总体参数的各种置信区间见表3-1。4.总体比例与比例差的置信区间 实际应用中经常需要对总体比例进行估计,如产品的合格率、大学生的就业率和手机的普及率等。记π和P分别表示总体比例和样本比例,则当样本容量n很大时(一般当nP和n(1–P)均大于5时,就可以认为样本容量足够大),样本比例P的抽样分布可用正态分布近似。总体比例与比例差的置信区间如表3-2所示。3.1.2假设检验 1.假设检验的基本原理 对总体参数进行假设检验时,首先要给定一个原假设H0,H0是关于总体参数的表述,与此同时存在一个与H0相对立的备择假设H1,H0与H1有且仅有一个成立;经过一次抽样,若发生了小概率事件(通常把概率小于0.05的事件称为小概率事件),可以依据“小概率事件在一次实验中几乎不可能发生”的理由,怀疑原假设不真,作出拒绝原假设H0,接受H1的决定;反之,若小概率事件没有发生,就没有理由拒绝H0,从而应作出拒绝H1的决定。2.假设检验的步骤 1)根据问题确立原假设H0和备选假设H1; 2)确定一个显著水平,它是衡量稀有性(小概率事件)的标准,常取为0.05; 3)选定合适的检验用统计量W(通常在原假设中相等成立时,W的分布是已知的),根据W的分布及的值,确定H0的拒绝域。 4)由样本观测值计算出统计量W的观测值W0,如果W0落入H0的拒绝域,则拒绝H0;否则,不能拒绝原假设H0。注意:在SAS系统中,是由样本观测值计算出统计量W的观测值W0和衡量观测结果极端性的p值(p值就是当原假设成立时得到样本观测值和更极端结果的概率),然后比较p和作判断:p<,拒绝原假设H0;p,不能拒绝原假设H0。p值通常由下面公式计算而得到。 ●p=P{|W|≥|W0|}=2P{W≥|W0|} (拒绝域为两边对称的区域时) ●p=min{P{W≥W0},P{WW0}} (拒绝域为两边非对称区域时) ●p=P{W≥W0}(拒绝域为右边区域时) ●p=P{WW0}(拒绝域为左边区域时) 只需根据SAS计算出的p值,就可以在指定的显著水平下,作出拒绝或不能拒绝原假设的决定。3.正态总体均值和方差的假设检验 对正态总体的参数进行假设检验是假设检验的重要内容,如对单总体均值、方差的检验、两总体均值之差的检验和两总体方差比的检验等。正态总体参数的各种检验方法见下表3-3至表3-5。 表3-3单正态总体N(μ,2)均值μ的检验法表3-4单正态总体N(μ,2)方差2的检验法表3-5两正态总体的均值差与方差比的检验4.总体比例与比例差的检验 当样本容量n很大时,可根据表3-6对总体比例与比例差进行假设检验。 表3-6总体比例与比例差的检验3.2总体均值的区间估计与假设检验的SAS实现 3.2.1使用INSIGHT模块 3.2.2使用“分析家” 3.2.3使用TTEST过程3.2.1使用INSIGHT模块 1.总体均值的区间估计 【例3-1】某药材生产商要对其仓库中的1000箱药材的平均重量进行估计,药材重量的总体方差未知,随机抽取16箱样本称重后结果如表3-7所示。 表3-716箱药材重量(单位:千克) 设药材重量数据存放于数据集Mylib.yczl中,其中重量变量名为weight。求该仓库中每箱药材平均重量在95%置信水平下的置信区间。步骤如下: 1)启动INSIGHT模块,并打开数据集Mylib.yczl; 2)选择菜单“Analyze”→“Distribution(Y)”; 3)在打开的“Distribut