预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共69页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

§5.1不等概抽样什么时候使用不等概抽样?实际工作中如果遇到下面几种情况则可以考虑使用不等概抽样:1、抽样单元在总体中所占的地位不一致2、调查的总体单元与抽样总体的单元不一致3、改善估计量二、不等概抽样的种类放回不等概抽样中最常用的是按照整体单元的规模大小来确定单元在每次抽样时的入样概率假设总体中第i个单元的规模度量为总体的总规模为每次抽样中第i个单元被抽中的概率用表示其中这种不等概抽样称作放回的与规模大小成比例的概率抽样(probabilityproportionaltosize)简称PPS抽样。实际问题中总体单元大小的度量往往不止一个比如企业员工数量、产值、销售量、利润等都可以度量企业规模的大小。PPS抽样的实施主要有两种方法:代码法和拉希里(Lahiri)法下面我们用一个实例分别介绍这两种方法。代码数将代码数累加得到先在[1738]中产生一个随机数为354再在[1738]中产生第二个随机数为553最后产生第三个随机493。则它们所对应的第576号单元被抽中。(2)拉希里法(3121)2、不放回不等概抽样每次在总体中对每个单元按入样概率进行抽样抽取出来的样本单元不放回总体对总体中剩下的单元进行下一次抽样。不放回不等概抽样的效率比放回时的效率高但是样本不独立会加大抽样实施、参数估计及精度计算的难度。对于不放回不等概抽样样本的抽取可以有以下几种方法:(1)逐个抽取法。每次从总体未被抽中的单元中以一定的概率取一个样本单元。(2)重抽法。以一定的概率逐个进行放回抽样如果抽到重复单元则放弃所有抽到的单元重新抽取。(3)全样本抽取法。对总体每个单元分别按一定概率决定其是否入样。这种方法的样本量是随机的事先不能确定。(4)系统抽样法。将总体单元按某种顺序排列根据样本量确定抽样间距k在[1k]中产生一个随机数。§5.2放回不等概抽样超市如果超市的营业面积近似正比于超市的销售额那么超市A的销售额就占所有超市销售额的1/16因此超市A的销售额乘以权重16(包含概率的倒数)可以近似地估计所有超市的销售额。因此样本量为1的不等概抽样的总体总值估计量为:样本从上表可以算出:我们用同一个例题将不等概抽样与简单随机抽样作一比较以此认识不等概抽样的意义。与n=1的简单随机抽样相比简单随机抽样的样本样本我们来计算简单随机抽样的估计量方差二、一般有放回不等概抽样如果采用的是PPS抽样即则【例5.2】某部门要了解所属8500家生产企业当月完成的利润该部门手头已有一份上年各企业完成产量的报告将其汇总得到所属企业上年完成产量为3676万吨.考虑到时间紧准备采用抽样调查来推算当月完成的利润.根据经验企业的产量和利润相关性比较强且企业的特点是规模和管理水平差异比较大通常大企业的管理水平较高因此采用与上年产量成比例的PPS抽样从所属企业中抽出一个样本量为30的样本调查结果如下表.i要根据以上调查结果估计该部门所属企业当月完成的利润并给出95%置信度下的相对误差.如果要求在相同条件下相对误差达到20%所需的样本量应该是多少?方差及标准差的估计因此在置信度仍为95%、相对误差时所需样本量为:三、有放回不等概整群抽样在群规模不等的整群抽样中如果群的规模差异较大各个群对总体的影响会产生很大差别。这时可以采用不等概方式抽取群。其好处是把群的规模作为抽取样本的辅助信息提高了估计的精度而且方差估计有比较简单的形式。下面主要讨论以PPS抽样抽取群的情况。每次按的概率抽取第i个群由于群内的单元全部参与调查第i个群的总值为:估计量的方差是:【例5.3】某企业欲估计上季度每位职工的平均病假天数。该企业共有8个分厂(工人数资料见下表)现用不等概整群抽样拟抽取三个分厂为样本并以95%的置信度计算其置信区间。有关数据及抽样过程如下:分厂编号【解】采用PPS抽样利用随机数表在数字1~12950之间随机抽取3个数分别是0201107972和10281于是3分厂、6分厂和8分厂入选样本。用分别表示三个分厂职工的病假天数调查结果为:同样可求得估计量方差的估计值为:【评价】对于群规模不等的整群抽样采用不等概PPS抽样可以得到总体目标量的无偏估计估计量和估计量方差都有比较简明的形式估计的效率也比较高确实是值得优先采用的方法。但是此方法使用的条件是:在抽取样本前要了解有关群规模大小的信息。此外抽样过程比等概整群抽样更为复杂。§5.3多阶段有放回不等