关键字:博弈;囚徒困境
大家在很小的时候就开始玩石头、剪刀、布的游戏:石头赢剪刀,剪刀赢布,布赢石头。大部分人都认为这个游戏靠的是运气,其实这其中有很多策略,如果愿意多动动脑子,那么赢的概率要高很多。
统计研究显示,在这种快速摆出手部姿势的猜拳游戏中,石头是三种手势中玩家最喜欢出的一种,尤其是男性第一次出手更喜欢出石头。所以,如果和一个对猜拳游戏没有研究的男生玩这个游戏,第一局可以试着出布,获胜概率很大;第二局中,没有经验的人往往容易模仿对手上一局的手势,于是他很可能出布,所以,你在第二局中应该出剪刀。但是,如果对手对这种策略也有了解,那情形就不同了。
假设有两个男同学(小明和小雷)在玩猜拳游戏。第一局中小明准备出布,但是小雷也知道了这点知识,所以已经猜到小明要出布,那么小雷就会选择出剪刀。当然这个假设可以一直向下递推。
小明继续想:“对方以为我要出布,所以会出剪刀,那么,我就出石头反而会赢。”
小雷也会想:“小明同学对猜拳很有经验,所以,我想到的他也一定想到了,因此,他会出石头对付我,我应该出布。”
……
两个“高手”就这样通过思想进行了一场猜拳游戏。
猜拳之前要尽量观察对手出拳是否有什么偏好,比如喜欢某一个手势,或者每个手势轮流出等。这其中还有很多制胜方式,但是,其中的共性就是你要根据对方的手势来决定自己的选择。在这种游戏中,如果你猜透了对方心思,摸清了对方的规律,那你必胜无疑。
这种二人或多人在平等的对局中分别根据对方的策略来变换自己的对抗策略,达到取胜目标的理论被称为博弈论。博弈的英文为“game”,最直接的意思就是“游戏”,也就是通过“玩游戏”而获得人生竞争知识的理论。
博弈论思想在我国古已有之。中国古代的《孙子兵法》就不仅是一部军事著作,而且算是最早的一部博弈论著作。最具代表性的事例应属春秋时期的“田忌赛马”。语文课本中选用了这篇文章并做了详细的解释。
齐使者如梁,孙膑刑徒阴见,说齐使。齐使以为奇,窃载与之齐。齐将田忌善而客待之。忌数与齐诸公子驰逐重射。孙子见其马足不甚相远,马有上、中、下辈。于是孙子谓田忌曰:“君弟重射,臣能令君胜。”田忌信然之,与王及诸公子逐射千金。及临质,孙子曰:“今以君之下驷与彼上驷,取君上驷与彼中驷,取君中驷与彼下驷。”既驰三辈毕,而田忌一不胜而再胜,卒得五千金。于是忌进孙子于威王。威王问兵法,遂以为师。
将古文译为现代文的意思就是:
齐国使者到大梁来,孙膑以刑徒的身份秘密拜见,劝说齐国使者。齐国使者觉得此人是奇人,就偷偷地用车把他载回齐国。齐国将军田忌非常赏识他,并且待如上宾。田忌经常与齐国诸公子赛马,设重金赌注。孙膑发现他们的马脚力都差不多,可分为上、中、下三等。于是孙膑对田忌说:“您只管下大赌注,我能让您取胜。”田忌相信并答应了他,与齐王和诸公子用千金来赌注。比赛即将开始,孙膑说:“现在用您的下等马对付他们的上等马,拿您的上等马对付他们的中等马,拿您的中等马对付他们的下等马。”三场比赛完后,田忌一场败而两场胜,最终赢得齐王的千金赌注。于是田忌把孙膑推荐给齐威王。齐威王向他请教兵法后,就请他做军师。
这个故事告诉我们运用策略的重要,在实力、条件均等的情况下,巧妙地运用自己的力量,充分利用有利条件会得到出人意料的效果。当然在博弈中必须隐藏自己的底牌,否则,一旦让对方猜中自己的策略,那是必败无疑。但我国古代人们对博弈局势的把握只停留在经验上,没有向理论化发展。近代西方学者通过对博弈论的深入研究,使其发展成一门较完善的学科。
博弈论的思维在生活中处处可见。因为人的一生,就是不停地做决策的一生:写作业还是看电视,该报什么兴趣班,该报考哪个学校,该选择什么专业,长大后更是要面临该自己创业呢还是先给别人打工,该从事什么样的工作,该怎样与领导和同事相处,要不要换工作,甚至是要不要结婚,什么时候结婚等。在这些无数的决策过程中,需要做出你的选择,同时,你的身边充斥着和你一样的决策者,他们的选择与你的选择相互作用、互相影响。这时你就需要用上博弈了,通过估计对方的策略,寻求自己的最大胜算或利益。博弈论在其他许多方面都有广泛的应用,如政治、法律、军事、外交等。所谓“知己知彼,百战不殆”就是博弈论在战场上的生动事例。近年来博弈论在经济学领域的应用非常火爆。
从经济学的观点来看,博弈论研究的是理性的人之间如何进行策略选择。博弈论是指某个个人或是组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,各自选择相应行为或策略,并各自取得相应结果或收益,为了达到各自的目标和利益,各方必须考虑对手各种可能的行动方案,并力图选取对自己最为有利或最为合理的方案。
下面我们通过具体的博弈案例来了解一些博弈内容。
囚徒困境
“囚徒困境”博弈模型是最典型的一个博弈模型,讲述的是警察与小偷的故事。假设A和B两个小偷因为共同参与违法犯罪活动被警察抓住。警方将两人分别置于不同的两个房间内进行审讯。现在犯罪嫌疑人面临的选择是:如果两个犯罪嫌疑人背叛对方选择坦白罪行,则两人都被判刑入狱8年;但是如果只有一个犯罪嫌疑人坦白,另一个人没有坦白而是抵赖,则坦白者自首有功立即释放,被揭发者则加刑入狱15年;如果两人选择合作一块儿抵赖,则警方只能根据现有掌握的证据判两人分别入狱1年。
下表给出了“囚徒困境”博弈模型。
两名囚徒由于互相隔绝,并不知道对方的选择。因此,囚徒需要猜测对方做出什么样的选择来决定自己的选择。猜测过程如下:
A会想,如果对方抵赖,我坦白,那么我会无罪释放——0年监禁;如果对方坦白,我抵赖,那么我将会受到更严厉的惩罚——15年的监禁;如果对方抵赖,我也抵赖,那么会得到短期惩罚——8年的监禁。比较而言,对于一个理性人而言,坦白是最好的选择。同样,B也会这样想。从总体利益而言,两人选择互相合作是最好的结果,互相背叛是最差的结果。但最终双方背叛却是这场博弈中唯一可能达到的均衡结果,这个结果被称为“纳什均衡”。个体理性与集体理性之间的矛盾就被称为“囚徒困境”。
由囚徒困境可以推演出类似的两个国家在关税上面临的选择:①提高关税,以保护自己的商品;②与对方达成关税协定,降低关税以利各自商品流通。
当一国因某些因素不遵守关税协定,独自提高关税,另一国也会做出同样反应,实施提高关税的报复行为,这就引发了关税战,两国的商品贸易不畅,失去了对方的市场,对经济也造成损害(类似共同背叛的结果)。
由此还可以应用到两个厂家相互压低商品价格来夺取市场的案例,最后的结果是两败俱伤。
要想突破这种困境,就需要提前“合谋”,并且每个人都要充分信任对方不会做出背叛的选择。那么,如何提高合作性呢?就要建立持久的关系。单次发生的博弈和多次重复博弈的结果不会一样。这一点我们可以从火车站或者旅游景区的商品价格非常高、小贩更倾向骗人的事例来理解。经常出门或者旅游的人都知道,火车站附近、旅游景区里的物品价格都要比其他地方同样的商品贵出好多,甚至花大价钱买来的却是“假冒伪劣”产品,有的甚至是“天价”。这些事情用博弈论分析就是商家与消费者之间发生的单次博弈。火车站、旅游景区的游客大部分都是“过路客”,与商家进行第二次交易的概率很小,商家做的基本都是“一锤子买卖”,商家不需要考虑顾客的感受。因此,消费者在相对处于弱势的情况下,商家选择了“宰客”来实现自己的利益最大化,使顾客的利益受到侵害。
假设让这种博弈反复、连续进行的话,这时,如果商家想与消费者保持长期的合作关系,那么必然会知道如果有一次不讲诚信,将会失去以后长期合作的机会。这样,为了获得更长期、更稳定的利益,就会理性地克制不良行为,从而选择诚信与合作。在现实生活中,大商场或者小区里的小卖部与消费者之间的合作基本上都是重复性博弈,商家在做每一次决策时都会考虑到对以后的影响。那些不讲诚信的商家,或许会一时获得较大的利益,但是,长期在此居住的消费者是不会重新再进入这些不讲诚信的商场,自然这些商场也就不会生存下去。
这表明,在重复的囚徒困境中,博弈如果被反复地进行,则囚徒就有机会去“惩罚”另一个参与者前一回合的不合作行为。这时,合作可能会作为均衡的结果出现。欺骗的动机这时可能因受到惩罚的威胁而发生了改变,从而可能导向一个较好的、合作的结果。
智猪博弈
猪圈里有一头大猪,—头小猪。猪圈一侧的墙上放置着一个食槽,另一侧安装着一个踏板,控制着猪食的供应。如果其中的一只猪去踩动踏板,另一只等待的猪就有机会吃到落下的食物。假设当小猪踩动踏板时,大猪会在小猪跑到食槽之前刚好吃光所有的食物;若是大猪踩动了踏板,则还有机会在小猪吃完落下的食物之前跑到食槽,争抢到一些食物。在这样的情况下,两只猪会做出怎样的选择呢?答案是:小猪的最优选择均是“等待”;大猪的选择只能是“按”。对小猪而言,小猪踩踏板将一无所获,不踩踏板反而能吃上食物。大猪明白小猪是无论如何也不会去踩踏板的,自己去踩踏板总比不踩强,所以只好来回不停地踩踏板—抢食物。
对于小猪的“等待”策略,经济学称之为“搭便车”行为。比如说股份公司中,大股东和小股东之间就是“大猪和小猪”的关系,大股东由于投入了更多的资本,相应拥有更多的权力,也就会更加关注公司的经营状况,承担着搜集信息、监督的任务等,小股东则可以坐享其成。大企业与小企业之间也是如此,在新产品的研究、开发、打广告问题上,小企业可以让大企业承担研发风险,付出推广新产品的成本,然后等市场成熟后再进入。所以,“智猪博弈”的均衡常被称做“富人的绅士风度”或“小国对大国的剥削”。
博弈并不是要叫你使诈,而是要从互动决策的角度分析如何使选择更加理性,从而实现自身在博弈中的优势,并在这种互动中最终达到“双赢”的结果。