预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共48页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

博弈策略的生活解读走近博弈论我们学习博弈的目的就是通过博弈相关知识及著名的博弈案例,诸如囚徒困境、智猪博弈、斗鸡博弈等等,研究人们如何进行决策,以及这种决策如何达到均衡的问题。每个博弈者在决定采取何种行动时,不但要根据自身的利益和目的行事,还必须考虑到他的决策行为对其他人的可能影响,以及其他人的反应行为的可能后果,通过选择最佳行动计划,来寻求收益或效用的最大化。这门课在一定程度上,是为了提高在校大学生感性认识和理性认识的融合,明白做人做事的道理,掌握分析和处理一些事情的方法和技巧。一、博弈基础知识博弈的分类:1、分为合作博弈与非合作博弈。如果各博弈方能达成某种有约束力的契约或默契,以选择共同的策略,此种博弈就是合作博弈。反之,就属于非合作博弈。2、分为零和博弈、常和博弈与变和博弈。零和博弈指的是所有博弈方的得益总和为零。常和博弈则是指所有博弈方的得益总和等于非零的常数。变和博弈则是指随着博弈参与者选择的策略不同,各方的得益总和也不同。3、分为静态博弈与动态博弈。所有博弈方同时或可看作同时选择策略,采取行动的博弈是静态博弈。4、分为完全信息博弈与不完全信息博弈。纳什均衡 定义:在给定别人最优的情况下,自己最优选择达成的均衡。 假设有n个局中人参与博弈,给定其他人策略的条件下,每个局中人选择自己的最优策略(个人最优策略可能依赖于也可能不依赖于他人的战略),从而使自己利益最大化。所有局中人策略构成一个策略组合(StrategyProfile)。纳什均衡指的是这样一种战略组合,这种策略组合由所有参与人最优策略组成。即在给定别人策略的情况下,没有人有足够理由打破这种均衡。纳什均衡,从实质上说,是一种非合作博弈状态。 纳什均衡达成时,并不意味着博弈双方都处于不动的状态,在顺序博弈中这个均衡是在博弈者连续的动作与反应中达成的。纳什均衡也不意味着博弈双方达到了一个整体的最优状态,以下的囚徒困境就是一个例子。二、囚徒困境体现囚徒困境基本精神——背叛 形成囚徒困境的机制——担心自己成为傻瓜(处于囚徒困境时,两害相权取其轻) 启示:囚徒困境这个模型,几乎是博弈论的代名词。两个基于“坦白从宽,抗拒从严”审讯的囚徒,从理性的角度出发,会产生怎样的结局?结果却是,从个人理性并追求个人利益最大化,那么二人皆坦白,也就是背叛。这在四种策略中并不占优,那为什么不采用集体最优策略而合作呢?很简单的集体优化,必然侵害个人利益的最大化。当然这一切前提是理性假设,也就是著名的经济人假设:经济学中的人都是“小人”(管理学则认为人是“君子”)。破解这一困境的途径则是打破信息孤立,而执法者的反制则是维持孤立或者加强威胁。无论背叛还是合作,谁在这里面坚持到最后,谁将取胜。三、重复博弈—合作的开始在现实环境中,存在着一些道德因素,可以化解个人理性与群体理性的矛盾,维系整个社会的稳定。 有限次的囚徒困境.情况不同于无限次的囚徒困境的重复博弈。当临近博弈的终点时,采取不合作策略的可能性加大。即使参与人以前的所有策略均为合作策略,如果被告知下一次博弈是最后一次,那么肯定采取不合作的策略。所以要是博弈终点不确定性,只要存在继续合作的机会,背叛就会被抑制。 无名氏定理:博弈中双方合作时得益最大,但若一方不遵守合作约定,必定是另一方合作者吃亏。所以需要引入惩罚机制:谁违约,就要处罚他,使他不敢违约。博弈一方之所以会与另外一位合作,只是因为他知道,如果他今天被骗,明天还能对欺骗实施惩罚。奥曼先生把这一洞察结论称之为“无名氏定理” 启示:每一次人际交往其实都可以简化为两种基本选择:合作还是背叛。在人际交往中普遍存在囚徒困境:明知合作能带来双赢,但理性的自私和信任的缺乏导致合作难以产生。而且,如果博弈是一次性,那么必然加剧双方进行“坦白”的决心,选择相互背叛。而现实生活中反复交往的人际关系,则是一种“不定次数的重复博弈”。在较长的视野内,人与人交往关系的重复造成“低头不见抬头见”的关系,可以使交往主体之间走向合作。4、一报还一报—人际交往个体原则生活中有很多事情,法律和道德不好约束 美国密西根大学学者罗伯特·爱克斯罗德提出了一报还一报策略。他是一个政治科学家,研究方向是人与人之间的合作关系。 研究前提:一、每个人都是自私的;二、没有权威干预个人决策。研究的问题:一、人为什么要合作。二、人什么时候合作、什么时候不合作。三、如何使别人与你合作。一报还一报策略优点: 1、善良,是指它第一部总是向对方表达善意。它坚持永远不首先背叛对方,开始总是选择合作,而不是一开始就选择背叛或主动作弊。2、可激怒,是指对方出现背叛行动时,它能够及时识别并一定要采取背叛的行动来报复,不会让背叛者逍遥法外。3、宽容,是指它不会因为别人一次背叛,长时间怀恨在心或者没完没了的报复,而是在对方改过自新、重新回到合作轨道时,能既