预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第九章含虚拟变量的回归模型目前为止,在已学习的线性回归模型中,解释变量X都是定量变量。但有时候,解释变量是定性变量。9.1虚拟变量的性质通常在回归分析中,应变量不仅受一些定量变量的影响,还受一些定性变量的影响(性别、种族、肤色、宗教、民族、罢工、政团关系、婚姻状况)。如:美国黑人的收入比相应的白人的收入低。女学生的S.A.T.的数学平均分数比相应的男生低。定性变量通常表明了具备或不具备某种性质,比如,男性或女性,黑人或白人,佛教徒或非佛教徒,本国公民或非本国公民。把定性因素“定量化”的一个方法是建立人工变量,并赋值0和1,0表示变量不具备某种属性,1表示变量具备某种属性,该变量称为虚拟变量(dummyvariable),用符号D表示。虚拟变量一样可用于回归分析,一个回归模型的解释变量可以仅仅是虚拟变量,称为方差分析模型(ANOVA)。Yi=B1+B2Di+ui(9-1)其中Y=初职年薪Di=1,大学毕业=0,非大学毕业假定随机扰动项满足古典线性回归模型的基本假定,根据模型(9-1)得到:非大学毕业生的初职年薪的期望为:E(Yi|Di=0)=B1+B2(0)=B1(9-2)大学毕业生的初职年薪的期望为:E(Yi|Di=1)=B1+B2(1)=B1+B2(9-3)可以看出:截距B1表示非大学毕业生的平均初职年薪,“斜率”系数B2表明大学毕业生的平均初职年薪与非大学生的差距是多少;(B1+B2)表示大学毕业生的平均初职年薪。零假设:大学教育没有任何益处(即B2=0),可根据t检验值判定b2是否是统计显著的。例9.1大学毕业生和非大学毕业生的初职年薪模型(9-1)OLS回归结果如下:Yi=18.00+3.28Di(9-4)se=(0.31)(0.44)t=(57.74)(7.444)p值=(0.000)(0.000)r2=0.8737估计的非大学毕业生的平均初职年薪为18000美元(=b1),大学毕业生的平均初职年薪为21280美元(b1+b2)。根据括号中的t值,很容易验证b2是统计显著的,表明非大学毕业生和大学毕业生的初职年薪有差距。图9-1描绘了回归结果,回归函数是一个分段函数。在社会学、心理学、教育学领域,ANOVA模型用得很广泛,而经济学中很少。在许多经济研究中,回归模型中的解释变量有些是定量的,有些是定性的,称为协方差模型(ANCOVA)。9.2包含一个定量变量,一个定性变量的回归模型Yi=B1+B2Di+B3Xi+ui(9-6)其中Yi—公司职员的年薪Xi—工龄Di=1,女职员=0,男职员模型(9-6)包含了一个定量的变量X(工龄)和一个定性变量(性别)。假定E(ui)=0,则,男职员平均年薪:E(Yi|Xi,Di=0)=B1+B3Xi(9-7)女职员平均年薪:E(Yi|Xi,Di=1)=(B1+B2)+B3Xi(9-8)图9-2描绘了这两种不同的情况。(假定B1>0)模型(9-6)表明男、女职员的平均年薪对工龄的函数具有相同的斜率(B3),但截距不同。即男职员的平均年薪水平与女职员不同(多了B2),但男、女职员平均年薪对工龄的变化率相同。零假设:回归方程(9-7)和(9-8)有相同的截距(也即没有性别歧视)。再根据t检验结果判定b2的统计显著性。考虑:能否引入关于性别的两个虚拟变量?模型(9-6)可写为:Yi=B1+B2Xi+B3D1i+B4D2i+ui(9-9)D1i=1,男职员=0,女职员D2i=1,女职员=0,男职员无法估计模型(9-9),因为D1i与D2i存在完全共线性(即完全的线性关系)。很容易验证:D1=(1-D2)或D2=1-D1,也即D1,D2完全共线性。避免完全共线性问题的一般规则是:如果一个定性的变量有m类,则要引进(m-1)个虚拟变量。如果不遵循这个规则,就会陷入虚拟变量陷阱(dummyvariabletrap),也即完全多重共线性情形。虚拟变量的赋值是任意的。例子中令D=1,代表女职员,D