预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

样本量的确定 二值分布(估计比例时的样本容量) 这种情况下,表明可能的采样结果只有两种情况,即是与非的问题。比如调查某一批产品的合格率。样本量的确定主要受以下几个因素影响:置信水平、所能接受的抽样偏差(估计值与真实值的最大偏差)、总体数量;通过置信水平即可查表确定。 置信水平90%1.6495%1.9699%2.56通常情况下置信水平选择95%。抽样偏差为±5%,不过也不完全一定,抽样偏差的确定还是要考虑实际情况,比如最小的调查估计值p=5%,此时抽样偏差就应该小于5%。 这时,就可以确定样本量: P值的确定:用以前类似样本得到的结果来近似,如果完全不知道就设p=0.5,因为此时方差最大,可求得一个比较保守的样本容量。 样本容量和在p=0.5时运用简单随机抽样估计p值得到的抽样偏差 样本容量抽样偏差500.141000.105000.04510000.032 如果总体容量非常大,可近似为无穷,那么上面这个公式可简化成: 事实上当总体容量很小时,不会采用抽样调查,而是普查了。 正态分布(估计均值时的样本容量) 在这种情况下,表明采样的结果是具有多样性的,并不局限在0、1上。比如对某一城市老年人的患病年龄进行统计。这个时候,样本量同样受如下几个因素影响:置信水平、所能接受的抽样偏差(估计值与真实值的最大偏差)、总体数量。 样本量为: 表明的是总体标准差,这个可以用以前类似样本得到的或是实验调查样本的来近似。 同样,如果总体容量非常大,可近似为无穷,那么上面这个公式可简化成: 理论基础: 根据数理统计知识,样本均值对总体均值可构造如下统计量:,他满足标准正态分布,查表即可得到某一显著性水平下这个统计量的值,这里面的表示总体均值估计量的标准误差。 在无放回简单随机抽样情况下,总体均值估计量的标准误差表达式: 如果误差界限设为,那么: 解得: 对于二值分布,p的总体方差为: 此时: 当然,这里只考虑了简单随机抽样,对于分层抽样和整群抽样,需要再乘以一个设计效应,分层抽样效率高于简单随机抽样,效应因子小于1,整群抽样效率低于简单随机抽样,效应因子大于1. 总体大小对于样本量也是有影响的,当总体个数越小时,影响越明显。 二者之间并不是线性关系,因此样本量并不是越大越好。