预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

卡方检验是用途很广的一种假设检验方法,它在分类资料统计推断中的应用,包括:两个率或两个构成比比较的卡方检验;多个率或多个构成比比较的卡方检验以及分类资料的相关分析等。 卡方检验基本思想 在分类资料统计分析中我们常会遇到这样的资料,如两组大白鼠在不同致癌剂作用下的发癌率如下表,问两组发癌率有无差别? 处理发癌数未发癌数合计发癌率% 甲组52197173.24 乙组3934292.86 合计912211380.335219393是表中最基本的数据,因此上表资料又被称之为四格表资料。卡方检验的统计量是卡方值,它是每个格子实际频数A与理论频数T差值平方与理论频数之比的累计和。每个格子中的理论频数T是在假定两组的发癌率相等(均等于两组合计的发癌率)的情况下计算出来的,如第一行第一列的理论频数为71*91/113=57.18,故卡方值越大,说明实际频数与理论频数的差别越明显,两组发癌率不同的可能性越大。利用统计学软件分析结果如下:datakafang;inputrowcolumnnumber@@;cards;115212192139223;run;procfreq;tablesrow*column/chisq;weightnumber;run; 统计量自由度值概率 卡方16.47770.0109(有统计学意义) 似然比卡方17.31010.0069 连续校正卡方15.28680.0215 Mantel-Haenszel卡方16.42030.0113 Phi系数 -0.2394 列联系数 0.2328 Cramer的V -0.2394 二联表的卡方检验方法 假设有两个分类变量X和Y,它们的值域分另为{x1,x2}和{y1,y2},其样本频数列联表为: y1y2总计 x1aba+b x2cdc+d 总计a+cb+da+b+c+d若要推断的论述为H1:“X与Y有关系”,可以利用独立性检验来考察两个变量是否有关系,并且能较精确地给出这种判断的可靠程度。具体的做法是,由表中的数据算出随机变量K^2的值(即K的平方)K^2=n(ad-bc)^2/[(a+b)(c+d)(a+c)(b+d)]其中n=a+b+c+d为样本容量K^2的值越大,说明“X与Y有关系”成立的可能性越大。当表中数据a,b,c,d都不小于5时,可以查阅下表来确定结论“X与Y有关系”的可信程度: P(K^2≥k)0.500.400.250.150.10 k0.4550.7081.3232.0722.706 P(K^2≥k)0.050.0250.0100.0050.001 k3.8415.0246.6357.87910.828例如,当“X与Y有关系”的K^2变量的值为6.109,根据表格,因为5.024≤6.109<6.635,所以“X与Y有关系”成立的概率为1-0.025=0.975,即97.5%。 四格表资料的卡方检验 四格表资料的卡方检验用于进行两个率或两个构成比的比较。1.专用公式:若四格表资料四个格子的频数分别为a,b,c,d,则四格表资料卡方检验的卡方值=n(ad-bc)^2/(a+b)(c+d)(a+c)(b+d),自由度v=(行数-1)(列数-1)2.应用条件:要求样本含量应大于40且每个格子中的理论频数不应小于5。当样本含量大于40但理论频数有小于5的情况时卡方值需要校正,当样本含量小于40时只能用确切概率法计算概率。 行X列表资料的卡方检验 行X列表资料的卡方检验用于多个率或多个构成比的比较。1.专用公式:r行c列表资料卡方检验的卡方值=n[(A11/n1n1+A12/n1n2+...+Arc/nrnc)-1]2.应用条件:要求每个格子中的理论频数T均大于5或1<T<5的格子数不超过总格子数的1/5。当有T<1或1<T<5的格子较多时,可采用并行并列、删行删列、增大样本含量的办法使其符合行X列表资料卡方检验的应用条件。而多个率的两两比较可采用行X列表分割的办法。 列联表资料的卡方检验 同一组对象,观察每一个个体对两种分类方法的表现,结果构成双向交叉排列的统计表就是列联表。1.R*C列联表的卡方检验:R*C列联表的卡方检验用于R*C列联表的相关分析,卡方值的计算和检验过程与行X列表资料的卡方检验相同。2.2*2列联表的卡方检验:2*2列联表的卡方检验又称配对记数资料或配对四格表资料的卡方检验,根据卡方值计算公式的不同,可以达到不同的目的。当用一般四格表的卡方检验计算时,卡方值=n(ad-bc)^2/[(a+b)(c+d)(a+c)(b+d)],此时用于进行配对四格表的相关分析,如考察两种检验方法的结果有无关系;当卡方值=(|b-c|-1)2/(b+c)时,此时卡方检验用来进行四格表的差异检验,如考察两种检验方法的检出率有无差别。列联表卡方检验应用中的注意事项同R*C表的