预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共146页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第5讲SAS系统与基础统计分析SAS分析的特点 (1)SAS将常用的统计方法用过程实现,是一个高品位的程序系统; (2)SAS是一个迅速发展的系统:融入最新的方法,不断适应用户的新需求; (3)SAS既可由编程也可用图形界面交互地实现分析功能; (4)SAS将各种专门分析方法融入为用户提供的直接使用的专用系统中--应用系统.如何学习SAS统计分析的功能 会找:针对问题和数据选用合适的分析工具. 统计基本概念统计基本概念统计基本概念 利用样本计算得到的各种统计量(包括图形)可以: (1)进行描述统计,即描述样本的各种主要 特征; (2)进行推断统计,即扩大所收集到的信 息的使用范围,用样本的特征来推断 总体的特征。总体的分布2、分布 作为总体的指标(即随机变量X),最重要的是了解它可能取什么值,以及取各个不同值的个体所占的比例。 一个变量(离散型随机变量)取不同数值的比例就称为这个变量的分布。分布最完整地描述了变量取值的特性。 3、累计分布(cumulative distribution): 一般地,若一个变量X(指离散型随机变量)所有可能取到的值为x1,x2,...,xn,...,则X的分布列为: x1,x2,...,xn,... p1,p2,...,pn,... 其中pi=P(X=xi)表示变量X取值xi的概率(或比例),用 表示累计分布。 4、累计分布函数(cumulative distributionFunction): 对于取值可能充满某个区间的数值型变量,例如测量的误差,某个地区学生的体重,我们无法或者没有必要将其可能的值一一列举,而只需要给出它落在不同范围的比例,例如误差为正的比例,误差绝对值小于0.1的比例。对这类变量,常用累计分布函数表示其在不同范围内取值的可能性。 F(x)=P(X≤x) 其中P(X≤x)表示变量X取值不超过x的概率(比例),这个比例随x的增加而增加,作为x的函数F(x)就称为累计分布函数,也简称分布函数。5、分布密度函数 对于连续型随机变量X,它的分布特征可以用以下定义的函数来描述:如果存在一个函数f(x)使得 则称f(x)为随机变量X的分布密度函数。 对于连续型随机变量,其分布函数的导数就是分布密度函数。 用SAS完成常规统计的常用方法和过程SAS系统内七种常用的描述性统计程序 旨在形容样本(Sample)的平均数标准差偏度峰度等统计值或为样本的数据绘图、制表格。 1=PROCMEANS 2=PROCSUMMARY 3=PROCUNIVARIATE 4=PROCCHART 5=PROCTABULATE 6=PROCCORR 7=PROCPLOT完成基础统计分析的几个常用过程 FREQ:计算变量取值的频数; MEANS:分类计算变量的常用统计量; SUMMARY:分类计算变量的常用统计量; UNIVARIATE:计算单变量的统计量和分 布的拟合检验; CORR:计算变量间的相关系数.频率分布和常用描述统计量FREQ过程(频数过程)5.WEIGHT语句 统计计算中我们统称假设每条观测记录对频数计算的贡献为1,使用WEIGHT语句可以定义每个观测值出现的频数为这个观测对应的权重(权重不能为负)。 6.BY语句 对由BY变量定义的几组观测分别进行分析。但要求先按BY变量排序。频率分布和常用描述统计量FREQ(频数)过程--频数表是变量取值分布的描述频率分布和常用描述统计量FREQ(频数)过程--定义输出格式的FORMAT过程频率分布和常用描述统计量FREQ(频数)过程--定义输出格式的FORMAT过程Procfreqdata=fitness; formatageagefmt.oxygenoxyfmt.; tablesgroupage/nocum; tablesage*oxygen/nocum; tablesgroup*age/listnocum; tablesgroup*age/out=outoutpct; run; procprintdata=out; run;频率分布和常用描述统计量描述统计量频率分布和常用描述统计量描述统计量--次序统计量频率分布和常用描述统计量描述统计量--描述数据中心位置的统计量频率分布和常用描述统计量描述统计量--描述数据离散程度的统计量频率分布和常用描述统计量§5描述统计量--与均值方差有关的统计量频率分布和常用描述统计量描述统计量--偏度(Skewness)频率分布和常用描述统计量描述统计量--峰度(Kurtosis)频率分布和常用描述统计量描述统计量--分位数(Quantile)频率分布和常用描述统计量描述统计量--分位数(Quantile)34相关系数相关系数(CorrelationCoef.)3738比较SUMMARY程序与MEANS程序 相同:都可以