预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共32页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第三讲假设检验 经典线性模型假定 对于模型,利用OLS有: 其证明可参见第二讲附录。在高斯-马尔科夫假定下,OLS估计量的抽样分布完全取决于误差项的分布。 在高斯-马尔科夫假定中,我们要求误差项是序列无关与同方差的。现在,我们施加更强的假定,即误差项服从正态分布,即。应该注意到,当误差项服从正态分布时,序列无关与独立性是等价的。因此,我们可以把上述分布假设写为:,即误差项服从独立同正态分布。为什么要施加更强的假定呢?这是为了进行小样本下的假设检验。与高斯-马尔科夫假定一起,被称为经典线性模型假定。在经典线性模型假定下,可以证明,OLS估计量是方差最小的无偏估计量(注意此时不需要把比较范围限制在线性估计量之中,因此该结论比高斯-马尔科夫定理更强。施加更多的假设而得到更强结论,这非常自然!)。 笔记: 1、假设误差项服从正态分布的合理性在于,误差项是由很多因素构成的,当这些因素是独立同分布时,依照中心极限定理,那么这些因素之和应该近似服从正态分布。当然,这并不意味着用正态分布来近似误差项的分布总是恰当的,例如,各因素或许并不同分布。另外,如果y是价格这样的变量,那么假设误差项服从正态分布是不合理的,因为价格不可能是负数,不过我们可以进行变量变换,例如对价格取自然对数或者考察价格的变化率,那么经过变量变换之后,或许再假设误差项服从正态分布就变得合理了。 2、如果能够对误差项是否服从正态分布进行检验,那最好不过了。一种常用的检验方法是Jarqe-Bera检验,这可以参见相关的教科书。问题是,尽管我们能观察到解释变量、被解释变量的取值,然而,由于对参数的真实取值无法确定,因此误差是观测不到的,我们或许不得不利用残差来代替误差以进行相关的检验。当然,一个前提是残差确实是对误差的良好近似,这进而要求,我们对参数的估计是合理的。 3、根据公式: 考虑x非随机这种简单情况,显然,当样本容量很大时,只要误差项是独立同分布的(并不需要要假定误差项服从正态分布),那么根据中心极限定理,应该近似服从正态分布。当然,为了保证误差项的独立性,抽样的随机性十分关键。 利用标准正态分布作假设检验 假定是真实模型,当然我们并不知道各参数的真实值是多少。如果某一经济经济理论预言,而现在你手中正掌握一样本,一个问题是,你所掌握的样本支持这个预言吗? 笔记: 由于抽样误差的存在,恰好等于的概率很小。然而,即使,我们也不能说理论被证实,因为计量经济学方法本质上是属于归纳法,并且由于其结论是基于某一样本而得到的,因此它还是属于不完全归纳,故,计量经济学不能证实经济学理论。当然,计量经济学也不能推翻经济学理论。经济学理论是逻辑推导,其正确与否需要从逻辑入手。总而言之,我们能够说的是“样本是否支持某个理论的预言”或者“样本与某个理论的预言是否一致”。 在经典线性模型假定下,或者定义,则z就是所谓的z统计量。估计量是用来估计真实参数的,而统计量是用来做统计推断(或者假设检验)的;统计量是随机的,其分布也被称为抽样分布,针对特定样本,我们得到统计量值,它是非随机的。 ,其中,。 练习:确定的分布。 现在,假设经济理论的预言是正确的,那么针对特定的样本你将得到标准正态分布图横坐标上的一个点:在这里,该式是非随机的,而特别应该注意的是,分子中的是估计值,而分母中的是估计量。估计值的标准差是零!。 。 现在来考察标准正态分布。在该分布上,存在对称的两点:与,其中: 如果把概率为5%的事件称为小概率事件,那么,当的取值大于或者小于时,我们认为小概率事件发生了!小概率事件一般是不容易发生的,现在居然发生了,因此,我们应该怀疑上述经济理论所作出的预言。 笔记: 举一个生活中的例子。我预先认为某一个同学十分优秀。优秀学生某一次考试考砸了非常正常,然而连续十次考试考砸了就应该是小概率事件了。如果我预先所认为的那一个优秀同学确实连续十次考试都考砸了,我是不是应该对我的先验判断产生怀疑?当然,如果我就此认为那一个同学并不优秀,我也会犯错误,此即“第一类错误”,即“弃真”的错误。但犯这个错误的概率是很小的。如果优秀学生连续十次考试考砸了其概率是5%,那么我犯“第一类错误”的概率就是5%。 问题是,为什么我们取正态分布两端的区间作为小概率区间呢?为什么我们不在正态分布密度曲线中随意取一小段作为小概率区间? 从直觉上看,当这个假设为真时,即使估计值与完全相等不太可能,但估计值应该接近于。然而我们也要注意到,对的估计还存在精确性问题,这通过统计量的标准差体现出来。也就是说,在原假设为真时,即使估计值与有一定的差异,然而如果较大,那么在与间存在一定的也许是正常的。不过总的来看,当原假设为真时,z统计量值是应该接近于0的,这要么是因为中的分子确实接近于0,要么是因为尽管与有一定的差异,但主要是由较大所