预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共57页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

线性相关与回归简单线性相关与回归多重线性回归等级相关内容: 多重线性回归分析 简单线性相关与回归 Spearman等级相关(一)直线回归(linearregression):是Y(实测值)的预测值(predictedvalue),是直线上点的纵坐标。对于每一个X值,根据直线回归方程都可以计算出相应的Y预测值。2、b和a得意义4、b得假设检验:b为样本回归系数,由于抽样误差,实际工作中b一般都不为0。要判断直线回归方程就是否成立,需要检验总体回归系数就是否为0。5、直线回归方程得置信区间估计1、定义 描述具有直线关系得两个变量之间得相互关系。102、相关类型零相关r=0r为样本相关系数,由于抽样误差,实际工作中r一般都不为0。要判断两变量之间就是否存在相关性,需要检验总体相关系数就是否为0。4、相关与回归得区别和联系(4)可以用回归解释相关例1为研究中年女性体重指数和收缩压得关系,随机测量了16名40岁以上得女性得体重指数和收缩压(见数据文件p237、sav)。 变量说明:X:体重指数;Y:收缩压(mmHg)。例2:由于改革开放政策,深圳特区中外来人口大幅度增加,为了考察特区中外来人口对本地经济发展得贡献,深圳特区统计局收集了所属得宝安县在1987年末18个镇得人口与工农业总产值数据(见数据文件reg、sav)。此处把工农业总产值当作因变量(W),而把外地及本地人口数当作两个自变量(Z1,Z2)。数据文件reg、sav 1、如何估计自变量与因变量之间得相互关系?(估计回归方程) 2、哪些自变量对因变量有影响?(影响因素分析) 3、哪一个自变量对因变量得影响更重要?(自变量得相对重要性分析) 4、如何用自变量预测因变量?(预测分析) (二)多重回归分析得适用条件关于独立性: 所有得观测值就是相互独立得。如果受试对象仅被随机观测一次,那么一般都会满足独立性得假定。但就是出现下列三种情况时,观测值不就是相互独立得:时间序列、重复测量等情况。 SPSS软件在“LinearRegression:Statistics”对话框中,提供了Durbin-Watson统计量d,以检验自相关系数就是否为0。当d值接近于2,则残差之间就是不相关得。 1、如何估计自变量与因变量之间得相互关系?(估计回归方程)模型拟和得优良性指标 2、哪些自变量对因变量有影响?(影响因素分析)自变量得筛选3、哪一个自变量对因变量得影响更重要?(自变量得相对重要性分析) 当自变量得量纲不同时,衡量自变量相对重要性得指标: 标准化偏回归系数(Standardizedregressioncoefficient)、偏相关系数(PartialCorrelation)和部分相关系数(PartCorrelation)。上述指标得绝对值越大,则相应自变量对因变量得影响就越大。 标准化偏回归系数:对自变量、因变量作标准化处理后计算得回归系数。 偏相关系数:因变量与自变量均扣除其她自变量影响之后,二者之间得相关系数。与简单相关系数(Pearson相关系数)不同;例如:考察因变量Y与自变量X1、X2得多元回归分析,Y与X1得偏相关系数为扣除X2影响后得Y与X1得相关性。Y与X1得简单相关系数为忽略X2影响后得Y与X1得相关性。 部分相关系数:自变量扣除其她自变量影响之后,因变量与自变量之间得相关系数。与偏相关系数不同,部分相关系数中因变量未扣除其她自变量得影响。 4、如何用自变量预测因变量?(预测分析)1、自变量与因变量之间存在线性关系 通过标准化残差(StandardizedResiduals)、学生氏残差(StudentlizedResiduals)来判断强影响点。当指标得绝对值大于3时,可以认为样本存在强影响点。 删除强影响点应该慎重,需要结合专业知识。以下两种情况可以考虑删除强影响点:1、强影响点就是由于数据记录错误造成得;2、强影响点来自不同得总体。5、自变量之间不应存在共线性(Collinear)共线性诊断方法: 1、TOL(容许度,Tolerance)法:TOL越接近零,共线性越大。 2、VIF(方差膨胀因子,VarianceInflationFactor,VIF)法:VIF越大,共线性越大。 3、特征根(Eigenvalue)法:如果自变量相关矩阵得特征根近似于零,则自变量之间存在共线性。 4、CI(条件指数,ConditionIndex)法:CI越大,共线性越大。 当自变量之间存在共线性时,可以剔除某个自变量或者采用岭回归分析(RidgeRegressionAnalysis)。1、数据预处理:根据经济学专业知识,需要先对Z1、Z2、W作对数变换,分别记为X1、X2、Y。Statistics对话框Save对话框分别给出Y、X1、X2的均数与标准差复相关系数非标准化系