预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共57页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

博弈论理和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为三.支付或收益(payoffs):例1.囚徒困境(prisoner’sdilemma)例1.囚徒困境(prisoner’sdilemma)例1.囚徒困境(prisoner’sdilemma)定义1:给定其它局中人的策略s,局中人i的最优反应记为s,是指能给他带来最大收益的策略,即定义2:一个策略组合s*=(s1*,s2*,…,sn*)被称为纳什均衡是指,对于所有的i,在囚徒困境中,考虑囚徒A对他人的最优反应。如果给定囚徒B的策略是“坦白”,那么对囚徒A来说,采取“坦白”策略得到的收益是-8,采取“抵赖”策略得到的收益是-10,显然“坦白”为好;同理,如果给定囚徒B的策略是“抵赖”,对囚徒A来说,“坦白”也比“抵赖”好。因此,囚徒A对囚徒B的最优反应是“坦白”。对囚徒B作同样分析:如果囚徒A的策略是“坦白”,则他采取“坦白”策略为好;如果囚徒A的策略是“抵赖”,他还是采取“坦白”策略好,所以囚徒B对囚徒A的最优反应也是“坦白”。两个最优反应形成了一个策略组合(坦白,坦白),这就是一个纳什均衡。两个寡头企业选择产量的博奕就是一个囚徒困境问题。回想一下古诺均衡的含义:古诺均衡是指存在这样一对产量组合(q1*,q2*),使得:假定企业2的产量为q2*时,q1*是企业1的最优产量;假定企业1的产量为q1*时,q2*是企业2的最优产量。按照纳什均衡的定义,古诺均衡(q1*,q2*)也就是博奕论中的纳什均衡。纳什均衡只说明博奕的稳定性结局。让我们再回到囚徒困境本身。纳什均衡(坦白,坦白)表明两人共同的集体选择,但是这个选择是否是理性的?理性选择是指使收益最大化的选择。如果两人都抵赖,各判刑1年,显然比坦白各判刑8年好。所以,纳什均衡(坦白,坦白)并不是一个集体理性选择。但它却是个人理性选择的一个组合。囚徒困境正是反映了一个深刻的问题,这就是个人理性与集体理性的矛盾。博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为比如,两家工厂生产的产品可能是互补的,一家为另一家提供零配件,这里有一个标准的选择问题,由于种种原因,很可能在产品标准的选择上,生产成品的厂家与生产零配件的厂家之间有冲突。这就需要相互妥协,但妥协的结果有两种可能,或者是生产零配件的厂家适应生产成品的厂家,或者是生产成品的厂家适应于生产零配件的厂家。博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为博弈论和对策行为