预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

PAGE\*MERGEFORMAT9 第四章完全信息动态博弈及其均衡解 1.完全且完美信息动态博弈 完全信息博弈指的是参与者的收益是共同知识。 完全且完美信息动态博弈指的是:博弈中的每一步中参与人都知道这一步之前博弈进行的整个过程。因此,我完全且完美信息动态博弈的特点:(1)行动是顺序发生的;(2)下一步行动选择之前所有以前的行动都可以被观察到;(3)每一可能的行动组合下的参与人的收益都是公共知识。 而不完美信息博弈指的是,在某一步参与人不知道以往博弈所进行的历史或者没有观察到以往的所有行动。 例4.1.我们来考虑这样一个动态博弈:假定甲在开采一个价值4万元的金矿时需要1万元资金,乙有1万元资金。甲向乙借钱来开金矿。在这个博弈的第一阶段,甲向乙承诺:如果乙借钱给他的话,那么他就会将采到的金子与乙对半分成,即(2,3)——乙得到2万元的金子,同时收回自己的1万元投资。对于甲的承诺,乙如果不借钱给甲的话,那么博弈到此为止,双方收益为(0,1)。如果乙借钱给甲的话,那么博弈进入第二个阶段。在第二阶段中,若甲遵守他的承诺,分给乙一半的金子,这样两人的收益为(2,3),其中1万元为投资成本。〖JP3〗然而,若甲违背自己的承诺,博弈就会进入到第三个阶段:如果乙同甲打官司,那么由于打官司费时费力,两个人的收益为(0,1);若乙不打官司,那么两个人的收益就为(5,0)。参见图1。 乙 甲 借不借 甲 乙 分不分(0,1) 乙 乙 (2,3)打官司不打官司 (1,2)(5,0) 图1.借钱博弈的博弈树 2.逆向归纳法与子博弈纳什均衡解 逆向归纳法(Backwardinduction)又称逆推法,是指这样一种动态博弈求解方法:从博弈的最后一步开始,计算最后一步的参与人的最优行动,逐步逆推到博弈开始时进行第一步的参与人的最优行动,从而确定每个参与人的最优行动。 在动态博弈中逆向归纳法能够进行的前提:参与人是理性的——任何一步参与人都选择最优策略;理性是公共知识——参与人选择最优策略是其他人所能够预测的。 在完全且完美信息动态博弈中逆向归纳法能够求得子博弈精炼纳什解。 乙 甲 借╳不借 甲 乙 分╳不分(0,1) 乙 乙 (2,3)打官司╳不打官司 (1,2)(5,0) 图2.借钱博弈的逆向归纳法的求解过程 在例4.1中这样一个动态博弈,用逆向归纳法,我们就可以推知,如果甲做出“不分”的选择,那么乙一定会选择“打”官司。因为对于乙而言,打官司的收益为1,不打官司的收益是0,所以,作为一个理性人,乙一定会选择打官司。而如果甲知道在“不分”的情况下乙必定选择“打官司”,那么甲就一定会选择“分”一半的金子给乙,因为对甲而言,“分”的收益是2,“不分”的收益是0。所以,甲的承诺是可置信的。而对于乙来说,他会选择“借”,因为“借”的收益是3,“不借”的收益是1。因此,该博弈最终的子博弈精炼纳什均衡点就是(2,3)。  例4.2.斯坦克尔伯模型。 两个厂商垄断某个市场,其中厂商1处于支配地位,它先行动,然后从属企业2后行动。假定市场需求函数为p=a-Q。厂商的单位产品的成本c。这些是企业1和2的公共知识。问:厂商1和2是如何决定的它们的生产产量的。 假定厂商1和2所决定的产量分别为q1,q2。 我们用逆向归纳法来求解。企业2后行动,对于企业1的任何行动,即任意给定的产量,企业2确定产量以使利润最大,即使L2=p×q2-c×q2最大。假定企业1决定的产量为q1,因为:L2=p×q2-c×q2=(a-q1-q2)×q2-c×q2 由dL2/dq2=0: q1-2q2=a-c(1) 即:q2=(q1-a+c)/2 企业1先行动,它能够预知企业2的最优化行为,即在它的最优产量q1给定的情况下,企业将按照q2=(q1-a+c)/2进行决策。这样,企业的利润函数为:L1=p×q1-c×q1=(a-q1-q2)×q1-c×q1=(a-q1-q2)×q1-c×q1而q2是q1如下的函数: q2=(q1-a+c)/2 由dL1/dq1=0: q1*=(a-c)/2 于是, q2*=(a-c)/4 因此,((a-c)/2,(a-c)/4)为逆向归纳法解。该解被称为子博弈精炼纳什均衡解。 此时总产量为q2=3(a-c)/4,价格为(a+3c)/4 企业1的利润L1=(a-c)2/8 企业2的利润为L2=(a-c)2/16 请读者与古诺均衡解进行比较。 3.动态博弈中的威胁与承诺 为了实现最大利益,使博弈在博弈参与人所希望的策略组合上实现,在他人作出行动之前的每一步参与人都会向对方可能做出某种威胁或承诺,希望对方做出或者不做出某个行动。而通过逆向归纳法我们能够区别动态博弈中威胁或承诺是否可信。 例4.1:甲向乙承诺:借钱给我