预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共34页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

概率论与数理统计 第十五讲数理统计学是一门应用性很强的学科。它研究怎样以有效的方式收集、整理和分析带有随机性的数据,以便对所考察的问题作出正确的推断和预测,为采取正确的决策和行动提供依据和建议。第六章样本与统计量数理统计的任务就是研究怎样有效地收集、整理和分析所获得的有限资料,并对所研究的问题尽可能地给出精确而可靠的推断。因此,数理统计中的方法和支持这些方法的相应理论是相当丰富的。概括起来可以归纳成两大类。 参数估计:根据数据,对分布中的未知参数 进行估计; 假设检验:根据数据,对分布的未知参数的 某种假设进行检验。 参数估计与假设检验构成了统计推断的两种基本形式,这两种推断渗透到了数理统计的每个分支。§6.2总体与样本实际上,我们真正关心的并不一定是总体或个体本身,而真正关心的是总体或个体的某项数量指标。 如:某电子产品的使用寿命,某天的最高气温,加工出来的某零件的长度等数量指标。因此,有时也将总体理解为那些研究对象的某项数量指标的全体。为评价某种产品质量的好坏,通常的做法是:从全部产品中随机(任意)地抽取一些样品进行观测(检测),统计学上称这些样品为一个样本。 同样,我们也将样本的数量指标称为样本。因此,今后当我们说到总体及样本时,既指研究对象又指它们的某项数量指标。例1:研究某地区N个农户的年收人。 在这里,总体既指这N个农户,又指我们所关心的N个农户的数量指标──他们的年收入(N个数字)。 如果从这N个农户中随机地抽出n个农户作为调查对象,那么,这n个农户以及他们的数量指标──年收入(n个数字)就是样本。例2:用一把尺子测量一件物体的长度。 假定n次测量值分别为X1,X2,…,Xn。显然,在该问题中,我们把测量值X1,X2,…,Xn看成样本。但总体是什么呢?又如:为研究某种安眠药的药效,让n个病人同时服用这种药,记录服药者各自服药后的睡眠时间比未服药时增加睡眠的小时数 X1,X2,…,Xn, 则这些数字就是样本。 那么,什么是总体呢? 设想让某个地区(或某国家,甚至全世界)所有患失眠症的病人都服用此药,则他们所增加睡眠的小时数之全体就是研究问题的总体。对一个总体,如果用X表示其数量指标,那么,X的值对不同的个体就取不同的值。因此,如果我们随机地抽取个体,则X的值也就随着抽取个体的不同而不同。 所以,X是一个随机变量! 既然总体是随机变量X,自然就有其概率分布。我们把X的分布称为总体分布。 总体的特性是由总体分布来刻画的。因此,常把总体和总体分布视为同义语。.例3(例l续):在例l中,若农户年收入以万元计,假定N户的收入X只取以下各值:0.5,0.8,l.0,1.2和1.5。取上述值的户数分别n1,n2,n3,n4和n5(n1+n2+n3+n4+n5=N)。则X为离散型分布,分布律为:例4(例2续):在例2中,假定物体真实长度为(未知)。一般说来,测量值X就是总体,取附近值的概率要大一些,而离越远的值被取到的概率就越小。 如果测量过程没有系统性误差,则X取大于和小于的概率也会相等。 在这种情况下,人们往往认为X服从均值为,方差为2的正态分布。2反映了测量的精度。于是,总体X的分布为N(,2)。说明:这里有一个问题,即物体长度的测量值总是在其真值的附近,它不可能取负值。 而正态分布取值在(-∞,∞)上。那么,怎么可以认为测量值X服从正态分布呢? 回答这个问题,有如下两方面的理由。例如:假定物体长度=10厘米,测量误差为0.01厘米,则2=0.012。 这时,(-3,+3)=(9.97,10.03)。于是,测量值落在这个区间之外的概率最多只有0.003,可忽略不计。 可见,用正态分布N(10,0.012)去描述测量值X是适当的。完全可认为:X根本就不可能取到负值;如若不然,就需要用一个定义在有限区间(a,b)取值的随机变量来描述测量值X。那么,a和b到底取什么值呢?测量者事先很难确定。 再退一步,即使能够确定出a和b,却仍很难找出一个定义在(a,b)上的非均匀分布用来恰当地描述测量值。与其这样,还不如干脆就把取值区间放大到(-∞,∞),并用正态分布来描述测量值。这样,既简化了问题,又不致引起较大的误差。●如果总体所包含的个体数量是有限的,则 称该总体为有限总体。有限总体的分布显 然是离散型的,如例3。 ●如果总体所包含的个体数量是无限的,则 称该总体为无限总体。限总体的分布可以 是连续型的,如例4;也可是离散型的。例5:研究某大城市年龄在1岁到10岁之间儿童的身高。 显然,不管城市规模多大,这个年龄段的儿童数量总是有限的。因此,该总体X只能是有限总体。总体分布只能是离散型分布。样本的二重性样本X1,X2,…,Xn既被看成数值,又被看成随机变量,这就是所谓的样本的二重性。将上述结论推广到一般的