预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共40页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第三篇医学统计学方法第九章数值变量资料统计分析第一节数值型资料统计描述第二节正态分布和参考值范围预计第三节数值型资料统计推断第四节t检验和u检验第五节方差分析terminology统计分析包含统计描述和统计推断两大部分。统计描述(statisticaldescription)是用统计指标、统计表和统计图描述资料分析规律及其数量特征;统计推断(statisticalinference)包含总体参数预计和假设检验两个内容。参数预计:是用样本统计量预计总体参数所在范围。假设检验:是利用样本实际资料来检验事先对总体一些数量特征所作假设是否成立。第一节数值型变量资料统计描述例9.1某市150名20~29岁正常男子尿酸浓度(μmol/L),资料见表9-1。怎样进行统计描述?362.6统计描述内容:一、制频数(分布)表(表9-2)和频数分布图(图9-1)频数表用途(1)揭示资料分布特征和分布类型(2)便于发觉一些特大或特小可疑值(3)便于深入计算统计指标和统计分析处理二、计算统计指标(1)计算平均值—代表一组资料平均水平;(2)计算标准差---反应资料离散程度。三、绘制统计表和统计图一、编制频数分布表:制表步骤:(1)求极差或全距(range):R=Xmax-Xmin本例,R=428.7-278.6=150.1(μmol/L)。(2)决定组数、组段数和划分组距(classinterval):依据样本含量多少确定组数,普通设8~15组。组段数=取整(极差/组数)。本例:组段数=取整(150.1/10)=15.0115划分组距:每组段起点和终点分别称为下界和上界。组距:本组内上界和下界之差。(3)列频数表:按上述组段序列制成表形式,采取划记法或计算机将原始数据汇总,得出各组段中所包含观察例数,即为频数,如表9-2第(2)栏。将各组段及其对应频数列成表格,即为频数表(frequencytable),如表9-2。所绘图形见图9-1。资料分布类型:对称分布或正态分布;2.偏态分布:高峰在左侧或右侧;3.不规则分布:分布很散,无显著高峰二、计算平均值—代表平均资料平均水平1.平均值种类:(一)算术均值(arithmeticmean,average):惯用表示样本均值,希腊字母μ表示总体均值。适合用于对称分布数值型变量资料。其计算方法有:①直接法:χi(I=1,2,…,n)为第i个观察对象观察值表9-2分组资料加权法计算平均值及标准差用表(二)几何均值(geometricmean,G)适用条件:等比级数资料.原始观察值呈偏态分布、但数据经过对数变换后呈正态分布或近似正态分布资料。如医学实践中一些疾病潜伏期、抗体滴度、平均效价等。其计算方法有:①直接法:χi为第i个观察对象观察值抗体滴度(i)(三)中位数(median,M):将观察值按大小排序后,位次居中观察值。M=X(P=50%)在全部观察值中小于M观察值个数与大于M观察值个数相等。因为M不受个别特小或特大观察值影响,适合用于分布不规则或分散度很高资料.3个观察值:1,3,5.M=3;4个观察值:1,3,5,7.M=4.①直接法:设n为观察值个数,有公式(9-5)及(9-6)尿铅值(mmol/L)三、计算标准差---反应资料离散程度。数值变量数据频数分布有集中趋势和离散程度两个主要特征,只有二者相结合,才能全方面地认识事物。反应资料离散程度统计量(统计指标)有:(一)全距(range)或极差:R=Xmax-Xmin全距是一组观察值中最大值与最小值之差。(二)四分位数间距(quartileinterval):Q=X75%—X25%,Q包含了全部观察值中间二分之一.(三)方差(variance)和标准差(standarddeviation)例有3组同龄男孩体重(㎏)测量值以下,其平均体重都是30(㎏),试分析其离散程度。标准差简化计算方法:数学上可证实:标准差应用:(1)表示观察值变异程度(离散程度):在两组(或几组)资料均数相近、度量单位相同条件下,标准差大,表示观察值变异度大,即各观察值离均数较远,均数代表性较差。(2)结合均数描述正态分布特征和预计医学参考值范围。(3)结合样本含量n计算标准误。四分位数间距计算(interquartilerange,Q):中位数计算公式:25%位数计算公式:四分位数间距(interquartilerange,Q)计算公式:Q=X75%–X25%描述性统计量归纳变异系数(coefficientofvariation,CV):若比较度量单位不一样或均数相差悬殊两组(或几组)观察值变异度,则需用变异系数为相互比较指标。不属于描述性统计指标,是一个比较用统计指标。第二节正态分布和医学参考值范围一、正态分布(normaldistribution)表9-2尿酸浓度频数分布(一)