预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共89页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

样本量的确定本讲主要内容样本容量的确定分层抽样分配样本的标准影响调查样本容量的因素客户提供的经费能支持多大容量的样本 整个调查持续的时间有多长 调查需要多少访员 能招聘到的访员有多少1.给定精度水平下样本容量的确定标准误差 误差界限 变异系数非抽样误差由于我们将在某一给定误差界限下,阐述样本容量确定的过程,所以有必要复习一下置信区间的概念。2.误差界限对于估计值t,在给定其标准误差t的情况下,置信区间的公式可以表示为:(t-ztt+zt)常用的z值包括3.多大的抽样方差是可接受的多大抽样方差是可以接受对于不同的子总体,对精度的要求可能有所不同 例如,在一次全国范围的抽样调查中,对国家层次的数据,调查主办者可能需要±3%的误差界限;但对于省级层次的估计值,±5%的误差界限可能就可以满足要求; 而对于省级以下层次的估计值,±10%的误差界限可能就足够了。在这种情况下,通常对每个研究域都进行分层, 并单独计算各层的样本容量 将各个研究域中所有层的样本容量相加,便得到 了调查所需的总样本容量调查估计值有关的抽样方差有多大例如: 某公司决定,如果公司所在的地区中,至少有P=4%的人群对某一种产品存在需求,那么该公司就决定生产这种产品。因此,该公司的市场调研部准备对当地的居民一项调查,以便估计他们在这种产品上的消费需求。 对于P=4%±5%水平左右的调查估计值就不太合适,应规定更小的误差界限,如小于或等于±0.01、±0.02等,这时候置信区间应该是(0.05±0.01)或(0.05±0.02)。Table1 样本容量和在P=0.5时运用简单随机抽样估计P值得到的误差界限最佳的解决办法4.总体的变异程度我们来看假设有一个首次开展的调查,试图估计对某企业提供的服务持满意态度的顾客比例。对“顾客满意”这一指标,设置两个可能的值:满意或者不满意。表2 列出了持满意和不满意态度的顾客可能占的比例的组合要精确地测量总体中具有高度变异性或不 经常出现的特征是很困难的。 要对这样的变量提供精确的估计值,需要 较大的样本容量。 当研究的特征具有最大的变异程度时,调 查需要的样本容量也最大。 对于只取两个值的特征,则当这两个值在 总体中以50—50的比例出现时,特征的变 异程度最大。如果所研究特征的真实变异程度大于确定 样本容量时我们估计的变异程度,那么, 调查估计值的精度就会低于期望的精度。 相反,如果所研究特征的真实变异程度与 我们所估计的变异程度相比要小,那么, 与调查目标所要求的估计值相比,抽样调 查得到的估计值会更加精确。 确保达到调查要求的精度多个测量的指标5.总体的大小表3:显示了不同规模的总体在P=0.5时,使用简单随机抽样,且以误差界限为0.05、置信度为95%的标准估计P所需的样本容量对于小规模总体,通常必须调查较大比例的样本,以取得所期望的精度。因此,实际操作中,对小规模总体经常采用普查而不是抽样调查。 计算样本容量时,通常假定采用的抽样方式为简单随机抽样(SRS)。所以,如果样本容量计算公式假定为简单随机抽样。设计效果因子7.回答率例如,如果初始样本容量是400,而通过上述途径估计的回答率为75%,那么选择的样本容量就应该为:一个最简单的例子 没有无回答的简单随机抽样样本容量的计算公式在无放回简单随机抽样情况下 总体均值估计量的标准误差的表达式如果误差界限设为e,那么:其中,总体方差S2是最不容易得到的,通常需要根据过去对类似总体所做的研究作近似计算。求比例样本容量的确定若总体真值已知,那么直接将它代入上面的等式 就可以得到样本容量 若总体真值未知,而且也没有以前的信息可以利 用,那么可以P=0.5用,因为这时的方差最大, 可以求得一个比较保守的样本容量计算比例估计样本容量的详细步骤第1步:计算初始样本容量第2步:使用下列等式对总体的大小进行调整第3步:设计效果调整样本容量根据无回答再次进行调整,以确定最终的样本容量n样本容量确定的例子如果真实的总体比例落在总体比例的样本估计值的0.10范围内,则该出版商将感到满意。 换句话说,误差界限e为0.10。 出版商希望调查估计值的置信度为95%,这就意味着20次抽样中只有1次,所得的样本估计值确定的置信区间不包含总体真值P,而且,Z=1.96。 使用简单随机抽样SRS。 估计回答率为65%,即r=0.65。 由于事先没有关于顾客满意度真实比例P的可利用的信息,因此,我们假定方差取最大的情况,即假设P=0.5。 样本容量的计算步骤第2步:调整初始样本容量第3步:根据抽样设计效果来调整样本容量第4步:根据无回答情况进行调整 确定最终的样本容量n例2. 现准备实施一项民意调查,以决定赞成建立一个公园的居民的比例。总体由所有在两个城市和一个农村地区居住的、年龄在18岁及以上的居民组成。通