预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

在统计上,x和y变数的关系有两种理论模型,第一种是回归模型;第二种叫相关模型或双变数正态总体模型。回归模型除具有自变数和依变数的区别外,还具有预测的特征,即具有由x的数量变化预测y的数量变化。相关关系是指在一定范围内,一个变数的任一变量(如xi),虽然没有另一个变数的一个确定数值yi与之对应,但是却有一个特定的yi的条件概率分布与之对应,只要这种关系存在,我们就定义变数y和x有相关关系。相关模型中,没有自变数和依变数的区别,不具有预测特性,它仅表示两个变数的偕同变异。回归模型资料的统计方法叫回归分析,这一分析方法是要导出由x来预测或控制Y的回归方程,并确定当给自变数x为某一值时依变数y将会在什么范围内变化。相关模型资料的统计方法叫相关分析,这一分析是要测定两个变数在数量关系上的密切程度和性质。SAS系统的CORR过程能够计算两个变量间的相关系数,包括Pearson,Spearman,Hoeffding,Kendall等相关系数及其他一些统计量。CORR过程格式 PROCCORR; VAR变量表; WITH变量表; PARTIAL变量表; WEIGHT变量; FREQ变量; BY变量表; 复制代码 CORR过程语句说明一、PROCCORR语句选择项DATA=数据集指明需处理的数据集名,缺省时为当前数据集。OUTP=数据集要求产生一个含有Pearson相关的一个新数据集。OUTS=数据集要求产生一个含有Spearman相关的一个新数据集。OUTK=数据集要求产生一个含有Kendall相关的一个新数据集。OUTH=数据集要求产生一个含有Hoeffding相关的一个新数据集。PEARSON计算通常的Pearson积矩相关,是缺省值。SPEARMAN计算Spearman等级相关系数KENDALL计算Kendallτ-b系数。HOEFFDING计算HoeffdingD统计量。NOMISS将带有某一变量缺失值的观察值从所有计算中除去。VARDEF=DF|WGT|N|WDF指定计算方差和协方差的分母。N观察值个数,DF自由度,WGT权重合,WDF权重合减1。NOSIMPLE抑制简单统计。BEST=n只输出每个变量与其他变量间最高的n个相关系数。NOPRINT抑制任何报表的输出。NOCORR在输出数据集中不包括相关系数。NOPROB不输出相关系数的显著性测验。RANK将每一变量与其他变量的相关系数按由大到小的顺序排列。二、VAR语句VAR变量表指明要计算相关分析的变量名,缺省时,计算所有数值型变量间相关系数。三、WITH语句WITH变量表指明特别配对的变量名,与VAR语句配对使用,VAR语句列出相关矩阵上部出现的变量,WITH语句列出左侧出现的变量。四、PARTIAL语句PARTIAL变量表指明求偏相关时的偏变量名,同时激活NOMISS选择项。应用实例例1一些夏季害虫盛发期的早迟和春季温度高低有关。江苏武进县测定1956~1964年3月下旬至4月中旬旬平均温度累积值(x,单位:旬.度)和一代三化螟蛾盛发期(y,以5月10日为0)的数据见表1,试计算x和y的相关系数和决定系数。表1累积温和一代三化螟蛾盛发期的关系数据X累积温35.534.131.740.336.840.231.739.244.2Y盛发期12169273139-1●程序及说明 DATAnew; INPUTxy@@; CARDS; 35.51234.11631.7940.3236.8740.2331.71339.2944.2-1 PROCCORR; VARxy; RUN; ●输出结果及说明CorrelationAnalysis相关分析2'VAR'Variables:XYSimpleStatistics简单统计VariableNMeanStdDevSumMinimumMaximum变量名观察值个数平均数标准差总和最小数最大数X937.077784.25199333.7000031.7000044.20000Y97.777785.5852070.00000-1.0000016.00000PearsonCorrelationCoefficients/Prob>|R|underHo:Rho=0/N=9PEARSON相关系数XYX1.00000-0.837140.00.0049Y-0.837141.000000.00490.0可见,x与y相关系数为-0.83714,概率为0.0049,达到极显著水平。例2测定13块中籼南京11号高产田的每亩穗数(x1,单位:万)、每穗粒数(x2)和每亩稻谷产量(y,单位:斤),得结果如表2。试分析每亩穗数、每穗粒数和亩产量间的相关。表2每亩穗数(x1)、每穗粒数(x2)与亩产量(y)x1x2Yx1x2Yx1x2Y26.773.4100833.864.61