“我知道你知道我知道你知道……”
什么是博弈?它是经济学和数学中的一个复杂难懂的术语,是现实生活中的一种艺术,还是人的一种生存状态?
可以说,上面的几种说法都有道理,博弈论是数学的一个分支,又在运筹学和经济学领域得到了广泛的应用。如今,它也深入社会学的腹地,在人生的各个方面给人以深刻的启发,为人们指引出一条通往成功的康庄大道。
从古代的田忌赛马到今日国家间的军备竞赛,都可以看做是博弈理论的应用。
在日常生活中,博弈的例子比比皆是。比如,周末休息时张某一个人孤独地逛超市,本来想给自己找点快乐,可没想到却发生了一场始料未及的灾难。当他买完东西正在排队付款时,超市里突然发生了火灾。这时,超市里有很多人,却只有两个门,他必须选择一个逃生。要知道,其他人也要争抢着从这两个门中逃走。如果他的选择与大多数人的选择一致,那么他选择的门就会很拥挤,冲不出去被烧死的可能性会比较大。与此相反,如果他选择的门是少数人所选择的,那他逃生的几率就会增大。如果不考虑道德和其他因素,张某会怎样选择呢?这就是一种简单的博弈。当他做决定的时候,为了能够顺利逃生,必须先猜测其他人的想法,并根据猜测决定自己的策略。这样,我们就能很容易地理解博弈的定义,即一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,对各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
简单来讲,博弈就是策略的互动。在博弈大战中,个人或博弈的其他主体是不自由的,他们不能单纯从自己的意愿出发采取行动,而必须参考对方和其他方的想法和策略,并从中选择最有利于自己的策略。博弈的目的是为了赢,为了使自身利益最大化。
互动性是博弈的最大特色。就像两人下象棋,你出棋的时候,为了赢棋,得仔细考虑对方的想法,而对方出棋时也得考虑你的想法。所以你还得想到对方在想你的想法,对方当然也知道你想到了他在想你的想法。这就形成了一个线性的推理链:我知道你知道我知道你知道……这是一种典型的博弈思维。博弈论的基本假设:理性人
博弈论中有一个基本的假设,那就是博弈的参与者和行动者是理性的人。其中的理性是指参与者努力运用自己的推理能力使自己的利益最大化。对于这个词,有必要进行深入的阐释。
首先,理性的人一定是自利的。
所谓自利,就是追求自身利益的行为和倾向,经济学和博弈论中的自利和社会学中的自私不是一回事,在博弈论中,自利是一个中性词。博弈论假设参与者都是纯粹理性的,他们以自身利益最大化为目标。
比如,西力政治家一般以选票数目为自己确立目标,他的理f生选择就是采取最佳策略,让自己的选票数目最多,以便当选政府要员;商家一般以销售利润为自己确立目标,他们的理性选择就是运用各种方法,实现企业利润的最优化。
其次,“理生”和“道德”不是一回事。
理性的选择只是最有可能实现自己的目标,而不一定最合乎道德。理性和道德有时会发生冲突,但理性的人也不一定是不道德的。
最后,“理性”和“自由”不一定一致。
这一点,很多人都深有体会。小孩子对学习感到厌倦,但父母却认为只有好好学习,孩子将来才能有出息。于是,家长和孩子之间展开博弈,父母会根据孩子的行动采取各种各样的激励方案,孩子也会根据父母的行动寻找对策。这时,父母和孩子都是理性的,也都是不自由的,因为,父母的自由意愿应该是让孩子幸福快乐,但理性一点考虑,他们宁愿逼迫孩子学习。孩子的自由意愿是玩耍,但是由于知道父母会对其玩耍的行为进行惩罚,所以,理性地选择了为自己所讨厌的学习。这就是理性和自由的悖论。
当然,在现实中,理性的选择和自由的选择也有可能达成一致,这当然是最理想的状态。
理性模式的主要特征就是“目标明确”四个字,博弈的参与者十分清晰、明确地知道自己的目的,并为此而进行各种理性的选择。点击博弈论关键词
博弈由很多因素构成,每个博弈至少都包含五个基本要素。
1.参与者
也可以称之为决策主体,或者叫局中人、博弈者。在一场竞赛或博弈中,有两个参与者的博弈现象称为“两人博弈”,而多于两个参与者的博弈现象称为“多人博弈”。博弈中的参与者是游戏中的各种角色。
比如象棋,有这样几种角色:老将、相、士、车、马、炮和小卒子,俨然一支军队。每个角色都是棋局博弈的局中人。当然,比起真实的人生,这个模型过于简单了,但一样可以映射出现实的生活。
2.策略
一局博弈中,每个参与者都有可供选择的、实际可行的、完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案。一个参与者的一个可行的自始至终全局筹划的行动方案,称为这个参与者的一个策略。如果在一个博弈中,参与者都只有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。由于在人生中每个人都随时扮演着参与者的角色,人生也就随时面对各种选择,所以在人生这场大游戏里,策略的选择也就异常重要。一旦选择不慎,则可能出现人生的败局。
3.支付
所谓支付,就是所有参与者真正关心的东西,是参与者的收益或效用,我们一般称之为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时,每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付函数。每个人都有自己的支付函数,在整个人生的每一步行动中,其实都为自己简单地计算:过支付函数中效用的得失,也就是干—件事隋值还是不值。
4.信息
在博弈中,策略选择是手段,效用是目的,而信息则是根据目的采取某种手段的依据。信息是指局中人在做出决策前所了解的关于得失函数,或支付函数的所有知识,包括其他局中人的策略选择给自己带来的收益或损失,以及自己的策略选择给自己带来的收益或损失。在策略选择中,信息自然是最关键的因素,只有掌握了信息,才能准确地判断他人和自己的行动。
两军对垒,知己知彼者必然取胜。在牌桌上,出老千的人每次都赢。公司里都有机密文件,这是商业秘密,绝不能透露,透露一点则可能给公司带来厄运。
5.均衡
均衡是一场博弈最终的结果。均衡是所有局中人选取的最佳策略所组成的策略组合。均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在商品市场的供求关系中,如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。
在上述要素中,参与者、策略、支付和信息规定了一局博弈的游戏规则。均衡是博弈的结果,也是游戏结束的最后结局。博弈的几种基本类型
根据博弈中参与者是否了解对方的行动以便采取自己的行动,博弈可以分为静态博弈和动态博弈。
静态博弈是指参与者同时采取行动,或者尽管参与者采取的行动有先后顺序,但后行动的人不知道先采取行动的人采取的是什么行动。
举一个简单的例子。小孩子常常玩一种“剪刀、石头、布”的游戏,这就是一种静态博弈。两个小孩同时出招,出招之前,任何一方都不知道对方会出哪一招,只能根据自己的猜测或者随意选择自己的策略。这就属于静态博弈。
动态博弈是指参与者的行动有先后顺序,并且后采取行动的人可以知道先采取行动的人所采取的行动。
下面这个故事就包含了一个典型的动态博弈:
在一家小旅馆里,一位住店的男青年走入厕所。突然,一个打扮得花枝招展的女郎闪电似的跟着进了厕所,并迅速地把厕所门关上,对青年说道:“把你的钱和手表给我,不然我就喊你非礼。”
厕所里没有第三者,真相难以说清,不给钱女郎就喊非礼,弄不好会使自己声名狼藉。男青年遇此困境,并未惊慌失措,而是急中生智,用手指指自己张大的嘴巴,又指指自己的耳朵,然后“呜鸣啊啊”地叫起来。
女郎见事情不顺利,便想转身溜走。此时男青年掏出钢笔递给她,并将自己的手掌伸出来,示意女郎把刚才的话写在他的手掌上。
青年这一动作如此逼真,女郎以为真的遇到了哑巴,放松了警惕。她还想继续敲诈,便拿起笔在男青年的手上写道:“把钱和手表给我,不然就喊你非礼!”这个青年取得了女郎的罪证,便一把抓住她,大喊一声:“抓抢
劫犯!”
女郎是个惯犯,每天抢劫别人,没想到今天被人抓了。
在青年与女郎的博弈过程中,先是女郎威胁青年,接着是青年急中生智装哑巴,女郎与青年这一先一后的行为就是动态博弈了。青年根据女郎的威胁策略做出了装哑巴的行动,但到这里博弈过程并未结束。动态博弈就是把博弈过程重复下去,如果是无限重复,那就是无限动态博弈,有限重复就是有限动态博弈,像平时玩的接龙游戏就属于无限动态博弈,而案例中的女郎与青年的博弈显然是个有限动态博弈。接着女郎根据小伙子的行动判断出小伙子是哑巴,然后做出在小伙子手上写字的行动,直到小伙子又做出行动策略:喊抓抢劫犯。至此,整个博弈过程结束。
从知识的拥有程度来看,博弈又可以分为完全信息博弈和不完全信息博弈。
完全信息博弈指参与者对所有参与者的策略空间及策略组合下的支付有完全的了解,否则就是不完全信息博弈。
有名的“警察与小偷”博弈就是完全信息博弈:
某警察负责城市中某区的治安。警察要对该区的A、B两地进行巡逻。假定该区只有一个小偷要实施偷盗。警察要防止小偷的偷盗,但警察只能一次在一个地方巡逻。而对于小偷而言,他也只能去一个地方。假定A地需要保护的财产价值为2万元,B地的财产价值为1万元。若警察在某地进行巡逻,而小偷也选择了去该地,因警察在场,小偷无法偷盗该地的财物;若警察没有去某地巡逻,而小偷选择了去该地,则小偷偷盗成功。警察怎么巡逻才能使效果最好呢?
暂时不谈警察和小偷的最佳策略,单就此博弈本身而言,其中的信息比如A、B两地的财产价值、城区的交通环境等对于博弈双方都是公开的,不存在信息不对称的情况,这就是完全信息博弈。
如果对这个博弈模型稍加改造,假设警方在某个路口设下了埋伏,而小偷却不知情,也就是博弈的参与人之一(小偷)对所有参与者的策略空间(博弈的环境和条件)不完全了解,此博弈就会演变成不完全信息博弈。
以上是对博弈论几种基本类型的简单介绍。关于更详细的内容,会在下面的章节中讲到。纳什均衡:博弈困境的理性解
有一部为人们所熟知的电影《美丽心灵》,讲的是主人公纳什不寻常的学术生涯,这部电影曾让无数观众为之感动流泪,但也许人们并不清楚,其中的主人公的生活原型就是诺贝尔经济学奖获得者纳什。他曾经提出了著名的“纳什均衡”理论。这一理论是对博弈论的重大发展,甚至可以说是一场革命。
经济学家萨缪尔森有句名言:“你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词:供给与需求。”博弈论专家坎多瑞引申说:要成为现代经济学家,这只鹦鹉必须再多学一个词,这个词就是“纳什均衡”。曾有这样一个故事:
杰克和吉姆结伴旅游。经过长时间的徒步,到了中午的时候,杰克和吉姆准备吃午餐。杰克带了5块饼,吉姆带了5块饼。这时,有一个路人路过,路人饿了,杰克和吉姆邀请他一起吃饭,路人接受了邀请。杰克、吉姆和路人将8块饼全部吃完。吃完饭后,路人感谢他们的午餐,给了他们8个金币,路人继续赶路。杰克和吉姆为这8个金币的分配展开了争执。吉姆说:“我带了5块饼,理应我得5个金币,你得5个金币。”杰克不同意:“既然我们在一起吃这8块饼,理应平分这8个金币。”杰克坚持认为每人各4个金币。为此,杰克找到公正的夏普里。
夏普里说:“孩子,吉姆给你3个金币,因为你们是朋友,你应该接受它。如果你要公正的话,那么我告诉你,公正的分法是,你应当得到1个金币,而你的朋友吉姆应当得到7个金币。”杰克不理解。
夏普里说:“是这样的,孩子。你们3人吃了8块饼,其中,你带了5块铲,吉姆带了5块饼。你吃了其中的1/5,即8/5块,路人吃了你带的饼中的5—8/3=1/3块;你的朋友吉姆也吃了8/3块,路人吃了他带的饼中的5—8/3=7/3块。这样,路人所吃的8/3块饼中,有你的1/3块,有吉姆的7/3块。这样分法符合纳什均衡的原则,按这样来分,你只能得1个金币。”经夏普里这样一说,杰克也不再嚷着多分了。最后,杰克与吉姆达成协议,杰克只要了5个金币。
经过双方的博弈,双方的选择符合纳什均衡,因为杰克再多要1个金币,吉姆就不平衡了,而吉姆再多要1个金币,杰克也就不平衡了。所以杰克3个金币、吉姆5个金币是双方的最佳选择。
这个最佳选择就是杰克与吉姆之间博弈的纳什均衡。因为这个选择导致了一个不会令人后悔的结果,无论对方怎么做,双方对于自己的策略都很满意。在这个纳什均衡中,杰克不一定满意吉姆的所得,但是杰克的策略是应付吉姆策略的最优策略(否则,他便只能得到1个金币)。
这就是纳什均衡,现在人们运用这一理论来分析商业竞争和贸易谈判等各种现象,取得了突出的成就。这一理论的原理并不复杂,人人都能理解,在以后的章节中,我们将运用这一原理来分析许多生活中、职场中和商场上的种种现象,并寻求解决之道。社会:没有硝烟的博弈战场
博弈论虽然在学术领域显得深奥和神秘,但是如果能够将其思维的精髓抽象化,运用到人的生活和工作中来,它在社会上便大有用武之地,其实,从人与人之间的较量来看,整个社会就是一个没有硝烟的博弈战场。
张华是公司里的部门主任,他是一个“直肠子”的人,说话行事也没有一定的分寸。最近,他的直属上司王经理辞职了,因为他最有希望晋升,所以着实为此事高兴了一阵子。可事情远没有他想象的那么顺利。有一天,公司的老总找张华谈工作,话里话外透露了经理职位要以外聘的方式填补的信息。满心欢喜的张华顿时犹如被泼了一瓢冷水,脸色立刻就变了,虽然没有当面对老总表示不满,但私下里却牢骚满腹。
可他实在不理解老总的想法,他决定好好争取一下,所以张华又找到老总,并陈述自己的功绩,可老总还是坚持己见。张华有点愤怒了,一气之下,向老总提出了辞职,他觉得凭自己对公司立下的汗马功劳,老总一定舍不得他离开。可没想到,这次老总居然同意了。第二天,新经理的职位被和张华地位相当、能力不如张华的杨军担任了。其实,当天老总也对杨军说了与张华同样的话,但杨军却勤勤恳恳、任劳任怨,没有任何的不满。可见,张华由于不能克服.自己的不良情绪,把升迁的机会拱手让给了他人。
在上述案例中,张华和老总之间就是一场博弈,是一场职场的博弈,也是一次人际关系的互动。老总对张华说的话正是要看他的选择,他要根据张华的选择再做出自己的判断。结果,张华牢骚满腹,惹得老板不高兴,好机会自然落不到他身上。
博弈论的应用范围当然不局限于职场,生活中的各个方面如人际关系的互动、球赛或麻将的出招、股市的投资,等等,都可以用博弈论巧妙地解释。可以说,红尘俗世,博弈无处不在。
博弈论探讨的就是聪明又自利的“局中人”如何采取行动以及如何与对手互动。人生正是由一局又一局的博弈所组成,你我皆在其中竞相争取高分。脱下博弈论的术语外衣,演绎人人运用自如的博弈智慧
不要以为博弈论是那些高高在上的经济学家们才玩的游戏。博弈论其实发生在每个人的日常行为中,每个人在生活中都有意无意地运用博弈论的道理进行决策,从而实现自身利益的最大化。
唐代诗人柳宗元有一篇((童区寄传》,其中记载了一则博弈故事,文章的大体意思如下:
柳州有一个打柴、放牛的孩子区寄。一天,区寄正在一边放牧一边打柴,两个强盗把他绑架,反背着手捆起来,用布蒙住他的嘴,带他走了四十多里,准备到集市上卖掉他。区寄假装像小孩似的啼哭,假装害怕得发抖。强盗以为他好对付,就一起痛饮,不一会儿便喝醉了。一个强盗去交涉买卖;另一个躺着,把刀插在地上。区寄暗地里察看他睡着了,把捆手的绳子靠在刀刃上,用力上下磨刮,绳子终于被割断,他就拿起刀来杀了这个强盗,逃跑了。
区寄还来不及跑远,去交涉买卖的强盗回来了,抓住了他,十分震惊,要杀掉他。区寄急忙说:“当两个人的仆人,哪比得上当一个人的仆人呢?他待我不好,你果真能保全我的生命,并且好好待我,怎么处置都行。”这个强盗盘算了很久,心想:“与其杀了这个孩子,不如把他卖了;与其卖钱两个人分,不如我一个人独占。幸好这孩子杀了那家伙,好得很!”于是,就藏起另一个强盗的尸体,带着孩子到集市上窝藏强盗的人家,把区寄越发捆绑结实。半夜区寄趁强盗熟睡之机,自己翻转身,让捆绑的绳子靠近炉火烧断,又拿起刀杀了这个要卖掉他的强盗,接着大声哭叫。整个集市的人都大吃一惊。孩子说:“我是区家的孩子,不该做别人的仆人。两个强盗抓了我,我幸好把他们都杀了。希望把这件事报告官府。”管集市的小吏报告州官,州官又报告上级官员太府。太府召见孩子,觉得他既幼小又老实。刺史颜证觉得他与众不同,欲留他当衙门小吏,区寄不肯。刺史就给了区寄一些衣服,并让小吏护送他回到乡里。
区寄和强盗之间进行着一场博弈,在此博弈中,区寄无疑处于弱势地位,因为他是毫无社会经验、人小力弱的牧童,而对方则是纵横乡里、有着丰富经验的强盗;而且这强盗有备而来,手里拿着明晃晃的钢刀,区寄则没有任何武器。如果只看故事的开头,也许很少有人认为最后的胜出者竟是区寄,但此文的不同寻常之处也正在于此。区寄没有武器、没有经验、没有力量,但是他有头脑、有智慧、有谋略,这就是他最终克敌制胜的关键。
他没有单纯地根据自己的想法采取行动,而是同时分析了强盗的想法,并抓住了强盗的心理弱点,那就是:绑架小孩一定是为了卖钱,而且赚到的钱越多越好。
于是,他能够成功地说服强盗乙(后被区寄杀死的强盗)留下他的性命。可以想见,听了区寄的一番分析之后,强盗乙的想法是这样的:
“绑架小孩的目的就是为了挣钱,与同伙均分利润一定不如一人独吞利润好,所以,理论上讲我一个人占有这个小孩最合算。”
“由此可见,小孩杀死同伴,意味着我可以独吞利润,这个小孩杀伙伴在客观上帮助了自己。”
“于是,无论从哪个角度讲,我都不应该杀掉这个小孩。”
正是他的这种想法,给区寄留下了生还的机会和余地。最终,区寄果然杀掉了强盗,平安回到了家里。
虽然区寄当时并不知道“博弈”这个词的意思,他最终还是依靠博弈智慧逃离了犯罪分子的魔爪。这个故事能给我们的启发是:博弈智慧人人都拥有,只是有一些人还:不知道该怎样运用。
日常生活中我们耳熟能详的成语和典故,如围魏救赵、背水一战、暗度陈仓、釜底抽薪、狡兔三窟、先发制人、借鸡生蛋等都属于博弈策略。很多人认为这些策略只存在于久远的历史当中,与我们今天的现实生活无关,事实并非如此。如果你能够掌握博弈智慧,就能够对这些古老的计谋进行一番理性而系统的审视,你会发现身边的每一件让你头痛的小事,从夫妻吵架到要求老板加薪都能够借用博弈智慧达到自己的目的。而一旦你能够在生活和工作的各个方面把博弈智慧运用得游刃有余,成功也就在不远处向你招手了。