预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共41页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

4.2参数假设检验假设检验假设检验的内容4.3非参数假设检验配对资料的符号检验某数据分析公司研究加薪对数据分析员工作准确度的影响。结果如下表所示,问加薪对工作精确度有没有影响K0.05(15)=3, K0.05(10)=1? 提出原假设与备择假设 H0:样本所在的中位数=已知总体的中位数 H1:样本所在的中位数≠已知总体的中位数 进行单尾检验,把“≠”换成“<”或者“>” 计算差值,确定符号及其个数 样本各观测值中大于已知总体中位数的,记为“+”,“+”个数记为n+ 样本各观测值中小于已知总体中位数的,记为“-”,“-”个数记为n- 样本各观测值中等于已知总体中位数的,记为“0”,“0”个数记为n0 统计量K=min{n+,n-}配对试验资料符号秩和检验非配对试验资料符号秩和检验卡方分布拟合检验χ2检验的原理与方法χ2检验就是统计样本的实际观测值与理论推算值之间的偏离程度。 实际观测值与理论推算值之间的偏离程度就决定其χ2值的大小。理论值与实际值之间偏差越大,χ2值就越大,越不符合;偏差越小,χ2值就越小,越趋于符合;若两值完全相等时,χ2值就为0,表明理论值完全符合。性别要回答这个问题,首先需要确定一个统计量,将其用来表示实际观测值与理论值偏离的程度。性别为了弥补这一不足,可先将实际观测值与理论值的差数平方,即(O-E)2,再用差数的平方除以相应的理论值,将之化为相对数,从而来反映(O-E)2的比重,最后将各组求和,这个总和就是χ2。羔羊性别观测值与理论值 在用卡方时,若分布类型已知,但其参数未知,这时需要先用极大似然估计法估计参数,然后作检验.(注意,估计了几个参数,就要在相应的卡方估计量的自由度上减去相应的个数)在使用卡方检验时要注意两点:n要足够大,以及npi不太小这两个条件.例题1:自1965年1月1日至1971年2月9日共2231天中,全世界记录到里氏震级4级和4级以上地震共162次,统计如下:由最大似然估计法得在H0为真的前提下,故在水平0.05下接受H0,例2:医学家研究心脏病人猝死人数与日期的关系时发现,一周之中星期一心脏病人猝死者较多,其他日子基本相同。每天的比例近似为2.8:1:1:1:1:1:1. 现在收集到168个观察数据,其中星期一至星期日的死亡人数分别为:55,23,18,11,26,20,15。 现在利用这批数据,推断心脏病人猝死人数与日期的关系是否成立?解:该问题可以转化为检验心脏病猝死人数在一周时间内的分布是否同预期分布相同,可以使用卡方检验进行处理,过程如下: (1)建立零假设和备择假设 零假设:每天心脏病猝死人数分布同预期分布相同 备择假设:每天心脏病猝死人数分布同预期分布不同 (2)构造和计算统计量3.2卡方检验的例题3.2卡方检验的例题K-S检验与KS统计量K-S检验的步骤1.建立假设组: H0:Fn(x)=F(x) H1:Fn(x)≠F(x) 2.计算样本累计频率与理论分布累计概率的绝对差,令最大的绝对差为Dn; 3.用样本容量n和显著水平a查出临界值Dna; 4.通过Dn与Dna的比较做出判断,若Dn<Dna,则认为拟合是满意的。例:正态拟合。 某织布厂的工人产值情况如下表所示,试检验这些样本数据能否作正态拟合?解:首先,由于做正态拟合的均值、标准差未知,因此,先计算样本均值和标准差,再做正态拟合。通过对样本资料的计算得:=4.85;s=0.352,分别作为均值Û和的估计值,建立假设: H0:样本数据服从均值为4.85,标准差为0.352的正态分布 H1:样本数据不服从均值为4.85,标准差为0.352的正态分布 计算资料列如表8-2:表8-2正态拟合计算表根据表8-2中第(5)列数据,取最大绝对差数 D1000=0.025作为检验统计量。若取a=0.05,n=1000,从临界值表中查(检验表K-S)得: Dna=0.043。 因为D1ooo<0.043,故认为样本数据所提供的信息无法拒绝H0,即接受H0,认为可做正态分布的拟合。 K-S检验法是一种精确分布的方法,不受观察次数多少的限制。这个方法可应用于分组或不分组的情形。