预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共57页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

概率论与数理统计第22讲第七章假设检验统计推断的另一类重要问题是假设检验,在总体分布未知或虽知其类型但含有未知参数的时候,为推断总体的某些未知特性,提出某些关于总体的假设.我们需要根据样本所提供的信息以及运用适当的统计量,对提出的假设作出接受或拒绝的决策,假设检验是作出这一决策的过程.参数假设检验是针对总体分布函数中的未知参数而提出的假设进行检验,非参数假设检验是针对总体分布函数形式或类型的假设进行检验,本章主要讨论单参数假设检验问题§7.1假设检验的基本概念一,引例设一箱中有红白两种颜色的球共100个,甲说这里有98个白球,乙从箱中任取一个,发现是红球,问甲的说法是否正确?先作假设H0:箱中确有98个白球.如果假设H0正确,则从箱中任取一个球是红球的概率只有0.02,是小概率事件.通常认为在一次随机试验中,概率小的事件不易发生,因此,若乙从箱中任取一个,发现是白球,则没有理由怀疑假设H0的正确性.今乙从箱中任取一个,发现是红球,即小概率事件竟然在一次试验中发生了,故有理由拒绝假设H0,即认为甲的说法不正确.二,假设检验的基本思想假设检验的基本思想实质上是带有某种概率性质的反证法.为了检验一个假设H0是否正确,首先假定该假设H0正确,然后根据抽取到的样本对假设H0作出接受或拒绝的决策.如果样本观察值导致了不合理的现象发生,就应拒绝假设H0,否则应接受假设H0.假设检验中所谓"不合理",并非逻辑中的绝对矛盾,而是基于人们在实践中广泛采用的原则,即小概率事件在一次试验中是几乎不发生的.但概率小到什么程度才能算作"小概率事件",显然,概率越小,否定假设H0越有说服力.常记这个概率值为a(0<a<1),称为检验的显著性水平,对不同的问题,检验的显著性水平a不一定相同,但一般应取为较小的值,如0.1,0.05,或0.01等.三、假设检验的两类错误当假设H0正确时,小概率事件也有可能发生,此时我们会拒绝假设H0,因而犯了"弃真"的错误,称此为第一类错误.犯第一类错误的概率恰好就是"小概率事件"发生的概率a,即 P{拒绝H0|H0为真}=a.反之,若假设H0不正确,但一次抽样检验结果,未发生不合理的结果,这时我们会接受H0,因而犯了"取伪"的错误,称此为第二类错误.记b为犯第二类错误的概率,即 P{接受H0|H0不真}=b.理论上,自然希望犯这两类错误的概率都很小.当样本容量n固定时,a,b不能同时都小,即a变小时,b就变大;而b变小时,a就变大.一般只有当样本容量n增大时,才有可能使两者变小.在实际应用中,一般原则是:控制犯第一类错误的概率,即给定a,然后通过增大样本容量n来减小b.关于显著性水平a的选取:若注重经济效益,a可取小些,如a=0.01;若注重社会效益,a可取大些,如a=0.1;若要兼顾经济效益和社会效益,一般可取a=0.05.四,假设检验问题的一般提法在假设检验问题中,把要检测的假设H0称为原假设(零假设或基本假设),把原假设H0的对立面称为备择假设或对立假设,记为H1.例如,有一封装罐装可乐的生产流水线,每罐的标准容量规定为350毫升.质检员每天都要检验可乐的容量是否合格,已知每罐的容量服从正态分布,且生产比较稳定时,其标准差s=5毫升.某日上班后,质检员每隔半小时从生产线上取一罐,共抽取了6罐,测得容量(单位为毫升)如下: 353,345,357,339,355,360.试问生产线工作是否正常?本例的假设检验问题可简记为 H0:m=m0,H1:mm0,(m0=350)(1.1)形如(1.1)式的备择假设H1,表示m可能大于m0也可能小于m0,称为双侧(边)备择假设.形如(1.1)式的假设检验称为双侧(边)假设检验.在实际问题中,有时还需要检验下列形式的假设 H0:mm0,H1:m>m0, (1.2) H0:mm0,H1:m<m0, (1.3)形如(1.2)式的假设检验称为右侧(边)检验;形如(1.3)式的假设检验称为左侧(边)检验;右侧(边)检验和左侧(边)检验统称为单侧(边)检验.为检验提出的假设,通常需构造检验统计量,并取总体的一个样本值,根据该样本提供的信息来判断假设是否成立.当检验统计量取某个区域W中的值时,我们拒绝原假设H0,则称W为拒绝域,拒绝域的边界点称为临界点.五,假设检验的一般步骤(1)根据实际问题的要求,充分考虑和利用已知的背景知识,提出原假设H0及备择假设H1;(2)给定显著性水平a以及样本容量n;(3)确定检验统计量U,并在原假设H0成立的前提下导出U的概率分布,要求U的分布不依赖于任何未知参数;(4)确定拒绝域,即依据直观分析先确定拒绝域的形式,然后根据给定的显著性水平a和U的分布,由 P{拒绝H0|H0为真}=a确定拒绝域的临界值,从而确定拒绝域;(5)作一次具体的抽样,根据得到的样