预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共98页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第4章SAS基本统计分析功能目录4.1假设检验4.1.1正态性检验(univariate过程)2.举例输出结果中正态检验部分为:说明:4.1.2单样本均值的T检验(univariate过程)补充P值检验法:2.应用举例输出结果为:分析:说明:4.1.3两独立样本均值检验(TTest过程、npar1way过程)4.1.3两独立样本均值检验(TTest过程、npar1way过程)2.Ttest过程【例3】输出为:分析:分析:注:分析:4.1.4两相关样本均值检验(Univariate过程)4.1.4两相关样本均值检验(Univariate过程)2.实例分析输出部分结果:分析:注:分析:作业:P157习题1,3,5,74.2方差分析4.2.1单因素方差分析4.2.1单因素方差分析2.案例分析分析:4.2.2非参数单因素方差分析【例2】4.2.3多因素方差分析【例3】:分析:作业:P16015,16,174.3回归分析4.3.1直线回归总离差平方和的分解式: 总平方和TSS=解释平方和ESS+残差平方和RSS 即 判定系数: 回归模型的显著性检验(F检验): Ho:b1=b2=…=bk=0,H1:b1,b2,…,bk至少有一个不为0。 检验统计量 变量(如xi)显著性检验(t检验): H0:bi=0,H1:bi≠0 检验统计量2.reg过程3.应用举例分析:由散点图和相关分析可知weight和height,age间有较强的线性关系。分析:说明:说明:4.3.2非线性回归方法一:方法二:4.3.3二分类变量的Logistic回归(Logistic过程)数据要求:因变量为二分类变量,自变量可以是分类变量或等间隔测度的变量。 【例8.3】数据集data09-02.sav是乳腺癌患者的数据。变量包括:age(年龄)、time(患病时间)、pathscat(肿瘤扩散等级)、pathsize(肿瘤大小)、histgrad(肿瘤史)、ln-yesno(癌变部位的淋巴结是否含有癌细胞)。建立一个Logistic模型,并预测一个肿瘤大小为1cm,肿瘤史为1年,肿瘤扩散等级<2cm患病时间为1个月的60岁人癌变部位的淋巴结是否含有癌细胞。给定显著性水平α=0.05结果分析:结论:作业:P15016补充:某调查中收集了350大学生的数据信息,研究恋爱与否(变量V)与年龄(age)、地区(Location),各科平均成绩(score)、性别(sex)及身高(height)等变量的关系。各变量定义如下:age4.4属性数据分析4.4.1单个离散变量的拟合优度卡方检验【例1】4.4.2两个离散变量的列联表独立性检验方式一:方式二:两种方式的输出结果一样,如下图,每一个格子中有4个数:Frequency(频数)、percent(百分比)、RowPct(行百分比)、ColPct(列百分比)。在表的右侧有行总计的频数及百分比,在表的下侧有列总计的频数及百分比。说明:2.列联表独立性检验【例2】结果分析:零假设H0:吸烟与慢性支气管炎相互独立,由输出结果中peraons卡方独立性检验统计量为χ2=7.4688,p=0.0063,对于给定的显著性水平α=0.05,p<α,故拒绝H0,即认为吸烟与患慢性支气管炎间不是相互独立的。说明:4.4.3两个离散变量的关联度分析分析:作业:教材P16118掌握自学方法事半功倍