预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共119页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第八章抽样推断分析法第八章抽样推断分析法第一节抽样方法概述抽样的应用对不可能进行全面调查的社会现象对不必要进行全面调查的社会现象对普查资料进行必要的修正二、有关抽样的几个基本概念样本从总体抽取出的、用以代表和推断总体的部分单位的集合体。注意1.样本的单位必须取自总体;2.由一个总体可以抽取许多样本;3.样本的抽取必须排除主观因素的影响以确保其客观性与代表性。样本容量和样本个数样本容量:一个样本中所包含的个体单位数一般用n表示。样本个数:一个抽样方案中所有的可能被抽取的样本的总数量即可能的样本个数。第二节概率与概率分布简单随机抽样的两种方式简单随机抽样的两种方式简单随机抽样的样本个数二、事件及其概率实验中发生该事件的可能性大小。两种常用的复合事件的概率两种常用的复合事件的概率随机变量(i=12…)例:连续抛两次硬币正面向上的次数的概率分布为:离散型随机变量的概率分布还可以用概率分布函数来表示。例:连续抛两次硬币正面向上的次数的概率分布用分布函数表示为:一次试验只有两种结果:事件A发生或A不发生四、连续型随机变量的概率分布连续型随机变量的密度函数的性质:五、随机变量的数值特征数学期望的两个重要性质:连续型随机变量的方差方差的两个重要性质:六、正态分布——最重要的连续型随机变量分布正态分布的分布函数标准正态分布正态分布函数的标准化例1:设X~N(μσ2)求X落在区间(μ-aμ+a)的概率。例2:设部队战士的身高服从正态分布X~N(17542)军服厂要制100000套军服问身高在171~179的应制多少套?第三节抽样分布抽样分布的形成过程二、重复抽样分布样本变量样本工时平均工资(元)计算样本平均工时工资的平均数和标准差:从理论上推导样本平均数的分布:结论:在重复抽样的情况下样本成数的分布例:某产品的一级品率为80%现采用重复抽样方式从中抽取100件求样本一级品率的抽样平均误差。解:样本一级品率的抽样平均误差为:三、不重复抽样分布样本变量样本工时平均工资(元)计算样本平均工时工资的平均数和标准差:结论:在不重复抽样的情况下样本成数的分布例:要估计某地区10000名适龄儿童的入学率现采用不重复抽样方式从中抽取400名儿童检查有320名儿童入学求样本入学率的抽样平均误差。解:样本入学率的抽样平均误差为:四、大数定理与中心极限定理中心极限定理独立同分布的随机变量:设它们的平均数为方差为即(i=12…)。则当n趋于无穷大时算术平均数的分布趋近于正态分布。如果总体变量X的期望和方差有限:(i=12…)。从该总体中抽出一个容量是n的样本则样本平均数的分布随着n的增大而趋近于平均数是标准差是抽样平均误差的正态分布。中心极限定理应用于成数:例1:某高校考生入学成绩平均分为550分标准差为250分。从考生中随机抽100名问这100名考生平均成绩在540~580分之间的概率。例2:某县粮食平均亩产为760公斤标准差为380公斤。从中随机抽400亩求样本平均亩产在800公斤以上的概率。比较:上例中如果该县粮食亩产服从正态分布求亩产在800公斤以上所占的比例。例3:某厂零件加工的不合格品率为6%现从加工件中随机抽取100件求样本不合格品率在4%以下的概率。第四节抽样估计的方法与应用二、总体参数的点估计评价估计量优良性的三个标准:2、一致性:3、有效性:总体方差的估计:证明如下:注意:证明如下:三、总体参数的区间估计置信度的意义:设以样本平均数估计总体平均数Δ表示极限误差1-α表示置信度当样本为大样本时的分布接近于正态分布总体平均数的估计已知置信度1-α的区间估计步骤:已知允许极限误差Δ的区间估计步骤:例:某乡水稻20000亩亩产标准差为72.6公斤随机抽400亩平均亩产为645公斤(1)试以95%的概率保证程度估计该乡亩产量和总产量;(2)给定极限误差7.2公斤试对该乡亩产量和总产量进行区间估计。(1)由1-α=0.95(F(z)=0.975)查表得z=1.96总体平均数的估计例1:设钢珠的直径服从正态分布现从一批钢珠中随机抽出9个测量它们的直径并求得其样本的平均值是31.06毫米样本标准差是0.25毫米。试以95%的概率保证估计钢珠直径的置信区间。例2:灯具厂要估计一批灯泡的平均寿命。现随机地抽取50