预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共88页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第二章定量资料的统计描述第一节频数与频数分布步骤:(1)求全距:(极差)R=29.64-7.42=22.22(2)定组段数与组距:8~15个组段,组距i=全距/组段数(3)划组段:以一个稍小于或等于最小值的整数作为第一个组段的起点数据。下限:每个组段的起点(最小值)。上限:每个组段的终点(近似最大值)。注:最后一个组段应同时写出上限和下限来。(4)绘制整理表“下限≤x<上限”注:各组段的频数之和应等于总的观察例数。表2120名正常成年男子血清铁含量的频数分布表二、离散型定量变量的频数分布频率:各组的频数除以总例数n所得的比值。频率描述了各组频数在全体中所占的比重,各组频率之和等于100%。累计频数:本组段的频数与以前各组段的频数相加;累计频率:每组段的累计频数除以总例数。连续变量的频数分布图连续型变量的频数分布图,以直方的面积大小表示频率的多少。等距分组以横轴表示被观察变量,纵轴表示频率密度,以各矩形(宽度为组距)的面积代表各组段的频率。频数表的用途1.揭示频数分布的分布特征和分布类型。文献中常将频数表作为陈述资料的形式。2.便于进一步计算统计指标和进行统计分析处理。3.便于发现某些特大或特小的可疑值。90~192~094~096~098~0100~0110~112~114~116~118~120~122~124~126~128~130~132~134~136第二节定量变量的特征数平均数:描述一组同质计量资料的集中趋势;反映一组观察值的平均水平。常用的平均数有算术均数,几何均数和中位数。(一)算术均数(mean):简称均数,总体均数用希腊字母µ表示,样本均数用拉丁字母表示。1.计算方法1)直接法:适用于样本例数n较少的资料。其中X1,X2…Xn为各变量值,n为样本例数。2)加权法:适用于变量值较多的资料。f1,f2…fn分别为各组段的频数,X1,X2…X0为各组段的组中值,组中值=(本组段下限+下组段下限)/2。例2-3测得8只正常大白鼠总酸性磷酸酶(TACP)含量(U/L)为4.20,6.43,2.08,3.45,2.26,4.04,5.42,3.38。试求其算术均数。120名成年男子血清铁含量均数、标准差计算表(加权法)2.均数的两个重要特性1).各离均差的总和等于0。(总体中各变量值X与均数之差称为离均差)2).离均差的平方和小于各观察值X与任何数a之差的平方和。()即<设:a≠,则a=±d,d>03.均数的应用但它最适用于对称分布资料,尤其是正态分布资料。因为这时均数位于分布的中心,最能反映资料的集中趋势。(二)几何均数(geometricmean):(几何均数也称为倍数均数,用G表示)1.几何均数的计算方法1)直接法:适用于样本例数n较少的资料。将n个观察值X1,X2,X3…Xn的乘积开n次方对数形式:G=lg-1{(lgX1+lgX2+lgX3+…lgXn)/n}=lg-1(∑lgX/n)例2-57名慢性迁延性肝炎患者的HBsAg滴度资料为1:16,1:32,1:32,1:64,1:64,1:128,1:512。求其平均效价。2)加权法:适用于样本例数n较多的资料。例2-652例慢性迁延性肝炎患者的HBsAg滴度数据见表2-4,求其平均滴度。二)几何均数应用的注意事项:1)几何均数常用于等比级数资料或对数正态分布资料。2)观察值中不能有0。3)观察值中不能同时有正值和负值。中位数(median,M):将一组变量值从小到大按顺序排列,位次居中的那个变量值就是中位数。百分位数(percentile,Px):指把数据从小到大排列后位于第X%位置的数值。有n个观察值X1,X2…Xn,把他们由小到大按顺序排列成X1≤X2≤X3…≤Xn,将这n个观察值平均的分为100等份,对应于每一等份的数值就是一个百分位数,对应于前面X%个位置的数值称为第X百分位数,用Px表示。一个百分位数Px将总体或样本的全部观察值分为两部分,理论上,在不包括Px的全部数据中有X%的观察值比它小,有(100-X)%的观察值比它大。1.中位数和百分位数的计算1)直接法:适用于样本例数n较少的资料。将观察值按大小顺序排列,当n为奇数时,中间那个数就是中位数。当n为偶数时,中间两个数的平均数就是中位数。2)频数表法计算中位数和百分位数:适用于样本例数n较多的资料。累计频数:本组段的频数与以前各组段的频数相加;累计频率:每组段的累计频数除以总例数。公式为L为百分位数所在组段的下限,i为该组段的组距,fx为该组段的频数,fL为百分位数所在组段的前一组段的累计频数,n为总例数。例2-8利用表2-2的频数表求血清铁含量的中位数。例某市大气中SO2的日平均浓度见表2.5,求P25,P50,P75。例某市大气中SO2的日平均浓度见表2.5,求中位数,P25,P50,P75