预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共38页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第四章 多重共线性引子:发展农业和建筑业会减少财政收入吗?●可决系数为0.995,校正的可决系数为0.993,模型拟合很好。模型对财政收入的解释程度高达99.5%。 ●F统计量为632.10,说明0.05水平下回归方程整体上显著。 ●t检验结果表明,除了工业增加值和总人口以外,其他因素对财政收入的影响均不显著。 ●农业增加值和建筑业增加值的回归系数是负数。 农业和建筑业的发展反而会使财政收入减少吗?! 这样的异常结果显然与理论分析和实践经验不相符。 若模型设定和数据真实性没问题,问题出在哪里呢?第四章多重共线性第一节什么是多重共线性 在计量经济学中所谓的多重共线性(Multi-Collinearity),不仅包括完全的多重共线性,还包括不完全的多重共线性。 对于解释变量,如果存在不全为0的 数,使得 则称解释变量之间存在着完全的多重 共线性。当时,表明在数据矩阵中,至少有一个列向量可以用其余的列向量线性表示,则说明存在完全的多重共线性。 不完全的多重共线性,解释变量间毫无线性关系,变量间相互正交。这时已不需要作多元回归,每个参数j都可以通过Y对Xj的一元回归来估计。 二、产生多重共线性的背景第二节多重共线性产生的后果一、完全多重共线性产生的后果二、不完全多重共线性产生的后果2.对参数区间估计时,置信区间趋于变大 3.假设检验容易作出错误的判断 4.可能造成可决系数较高,但对各个参数单独的t检验却可能不显著,甚至可能使估计的回归系数符号相反,得出完全错误的结论。 第三节多重共线性的检验一、简单相关系数检验法注意: 较高的简单相关系数只是多重共线性存在的充分条件,而不是必要条件。特别是在多于两个解释变量的回归模型中,有时较低的简单相关系数也可能存在多重共线性。因此并不能简单地依据相关系数进行多重共线性的准确判断。 二、方差扩大(膨胀)因子法经验规则三、直观判断法3.有些解释变量的回归系数所带正负号与定性分析结果违背时,很可能存在多重共线性。 4.解释变量的相关矩阵中,自变量之间的相关系数较大时,可能会存在多重共线性问题。 四、逐步回归检测法第四节多重共线性的补救措施一、修正多重共线性的经验方法2.增大样本容量 如果样本容量增加,会减小回归参数的方差, 标准误差也同样会减小。因此尽可能地收集足 够多的样本数据可以改进模型参数的估计。 问题:增加样本数据在实际计量分析中常面临 许多困难。 3.变换模型形式 一般而言,差分后变量之间的相关性要比差分 前弱得多,所以差分后的模型可能降低出现共 线性的可能性,此时可直接估计差分方程。 问题:差分会丢失一些信息,差分模型的误差 项可能存在序列相关,可能会违背经典线性回 归模型的相关假设,在具体运用时要慎重。4.利用非样本先验信息 通过经济理论分析能够得到某些参数之间的关 系,可以将这种关系作为约束条件,将此约束 条件和样本信息结合起来进行约束最小二乘估 计。5.横截面数据与时序数据并用 首先利用横截面数据估计出部分参数,再利用 时序数据估计出另外的部分参数,最后得到整 个方程参数的估计。 注意:这里包含着假设,即参数的横截面估计和 从纯粹时间序列分析中得到的估计是一样的。 6.变量变换 变量变换的主要方法: (1)计算相对指标 (2)将名义数据转换为实际数据 (3)将小类指标合并成大类指标 变量数据的变换有时可得到较好的结果,但无 法保证一定可以得到很好的结果。二、逐步回归法若新变量的引入未能改进和检验,且对其他回 归参数估计值的t检验也未带来什么影响,则认为该 变量是多余变量。 若新变量的引入未能改进和检验,且显著地影 响了其他回归参数估计值的数值或符号,同时本身的 回归参数也通不过t检验,说明出现了严重的多重共 线性。第五节案例分析数据的收集与处理该模型计算各解释变量的相关系数三、消除多重共线性