预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共38页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

贝叶斯均衡及其应用预备知识(共同知识) 静态博弈中的贝叶斯均衡 不完全信息下的古诺模型 用贝叶斯均衡解释混合策略均衡 显示原理 动态博弈中的贝叶斯均衡 信号传递博弈的精炼贝叶斯均衡 单一价格二手车模型 就业市场信号博弈 信息不完全条件下的囚徒困境问题 不完全信息博弈: 不完全信息意味着至少有一个参与人有多个类型。不完全信息博弈是指、至少有一参与人不知道其他参与人的支付函数。比如说,你想去买件衣服时,你并不清楚衣服的最低价,你和某人谈恋爱,但在结婚前,双方都是展现最好的一面,双方都不是很了解对方的很多品质,等等,这样的例子举不胜举。在古代,人们已经开始用到不完全信息博弈了。比如在《三国演义》中,周瑜伪造假降书,诱骗曹操杀了蔡摺、张允二将。曹操遂派蔡中、蔡和两兄弟假装降周瑜,企图夺取东吴情报。周瑜识破曹操的诡计,将计就计,对黄盖施以苦肉计。这一博弈中,曹操只知道自己的部下蔡中、蔡和是假降,但不知道周瑜的情报周瑜知道蔡中、蔡和是假降,但曹操不知道周瑜知道自己是假降,曹操不知道周瑜已经识别了自己的计划。也就是说曹操的信息对周瑜的信息是不完全的,但周瑜很清楚曹操计谋,于是周瑜就将计就计。这一博弈属于不完全信息博弈。私人信息和共同信息的区别: 1、私人信息 2、共同信息共同知识 共同知识:并非是每个人都知道的知识 两个例子:脏脸问题信封之谜 脏脸问题: 甲、乙、丙三人都戴红帽子,他们可以看到对方的帽子颜色,但看不到自己帽子的颜色,问甲自己戴什么颜色的帽子?问乙自己戴什么颜色的帽子?问丙自己戴什么颜色的帽子?都回答不出。但一个旁观者告诉他们“他们至少有一人戴红帽子”,问甲自己戴什么颜色的帽子?问乙自己戴什么颜色的帽子?最后问丙自己戴什么颜色的帽子?甲、乙不知,丙却知道自己的是红帽子。他们没人都知道他们至少有一人戴红帽子,也知道对方也知道他们至少有一人戴红帽子,但是对甲而言,他不知道乙知道丙知道他们至少有一人戴红帽子,所以该信息虽然每人都知道,但不属于共同知识。 信封之谜: A有两个儿子M、N,他要给两个儿子一些钱,钱的数额分别写在给他们的信封中,并告诉他们,钱的数额为10n-1和10n(其中n为1-7之间的数),M的信封中为1000,N的信封中为10000,A问他们是否要交换,他们均同意,A又问你们确定要交换,他们还是都同意,A又问你们确定要交换,他们还是都同意,A再次问你们确定要交换,结果N不同意M同意。定义不完全信息下的古诺模型用贝叶斯均衡解释混合策略均衡显示原理完美贝叶斯均衡信号传递博弈的精炼贝叶斯均衡(0)自然按概率分布选择信号发出者的私人类型,并告知信号发出者,信号接收者不知,但知其分布类型。 (1)信号发出者了解后选择信号m并发射信号,m所在空间成为信号空间。 (2)信号接收者观察到信号m后形成对信号发出者的私人类型的判断——后验分布 然后选择行动a。 (3)根据行动参与人获得相应支付。信号要求: 1、信号接收者能够在观察到m后对发出者的私人类型进行判断,得出后验分布。 2R、信号接收者采取行动使其期望支付最大化。 2S、信号发出者采取行动使其支付最大化。 3、信号接收者对信号集中持有推断必须决定于贝叶斯法则和发送者的决策。 满足以上条件的策略组合和推断为信号传递博弈的精炼贝叶斯均衡。信号传递博弈求解混合均衡 不同类型的信号发送者选择相同的信号发送,这时,信号接收者根据所收到的信号,不能修改信号发送者类型的先验概率。 求解纯策略意义下信号博弈的精炼贝叶斯均衡的步骤单一价格二手车模型博弈树为:根据博弈树简单的分析我们可知,若P>C,V>P>W,则车况好时成交对双方都有利;车况差时成交则卖方得利买方损失;车况好时没成交则双方虽没损失,但丧失了得益机会;车况差时卖方想卖,但为交易,卖方损失,买方无损失。 因此,在满足P>C,V>P>W时,买卖双方积极的选择对自己都有一定的风险,保守的选择可能丧失潜在的得益机会。因此买方无法确定车况时,任一选择都不可能是绝对的上策,而卖方也因有花钱伪装而卖不出去的风险,两种选择也没有绝对优劣,双方的决策和博弈结果有许多中可能性。模型的纯策略完美贝叶斯均衡: 假设p(g|s)=pg,p(b|s)=pb,pb很小,C相对于P很小,则(卖,买)是市场的一个完美贝叶斯均衡。 买方选择买的期望得益为pg(V-P)+pb(W-P),由假设可以得到pg(V-P)+pb(W-P)>0,所以买方选择买;而对卖方而言,P>0,P-C>0,所以卖方选择卖。 就业市场信号博弈信息不完全条件下的囚徒困境问题有限次囚徒困境中,假设囚徒1有两种类型:理性和非理性,这是囚徒1的私人类型。两种类型的概率分布为两人的共同知识。P(理性)=1-p,P(非理性)=p 囚徒2是理性的,理性的囚徒可以选择任何策略,而非理性的囚徒仅选择“针