博弈论是指某个人或是组织,面对一定的环境条件,在一定规则的约束下,依靠所掌握的信息,从各自可选择的行为或是策略中进行选择加以实施,从各自的行为中取得相应结果或收益的过程。博弈论是在20世纪40年代形成并发展起来的,它原是数学运筹中的一个支系,后来又在军事、政治、经济等方面有很多重要的作用,并以在经济学领域的运用为最多,同时也最成功!“我知道你知道我知道你知道……”
什么是博弈?它是经济学和数学中的一个复杂难懂的术语,是现实生活中的一种艺术,还是人的一种生存状态?
可以说,上面的几种说法都有道理,博弈论是数学的一个分支,又在运筹学和经济学领域得到了广泛的应用。如今,它也深入社会学的腹地,在人生的各个方面给人以深刻的启发,为人们指引出一条通往成功的康庄大道。
从古代的田忌赛马到今日国家间的军备竞赛,都可以看做是博弈理论的应用。
在日常生活中,博弈的例子比比皆是。比如,周末休息时张某一个人孤独地逛超市,本来想给自己找点快乐,可没想到却发生了一场始料未及的灾难。当他买完东西正在排队付款时,超市里突然发生了火灾。这时,超市里有很多人,却只有两个门,他必须选择一个逃生。要知道,其他人也要争抢着从这两个门中逃走。如果他的选择与大多数人的选择一致,那么他选择的门就会很拥挤,冲不出去被烧死的可能性会比较大。与此相反,如果他选择的门是少数人所选择的,那他逃生的几率就会增大。如果不考虑道德和其他因素,张某会怎样选择呢?
这就是一种简单的博弈。
当他做决定的时候,为了能够顺利逃生,必须先猜测其他人的想法,并根据猜测决定自己的策略。这样,我们就能很容易地理解博弈的定义,即一些个人、团队或其他组织,面对一定的环境条件,在一定的规则约束下,依靠所掌握的信息,同时或先后,一次或多次,对各自允许选择的行为或策略进行选择并加以实施,并从中各自取得相应结果或收益的过程。
简单来讲,博弈就是策略的互动。在博弈大战中,个人或博弈的其他主体是不自由的,他们不能单纯从自己的意愿出发采取行动,而必须参考对方和其他方的想法和策略,并从中选择最有利于自己的策略。博弈的目的是为了赢,为了使自身利益最大化。
互动性是博弈的最大特色。就像两人下象棋,你出棋的时候,为了赢棋,得仔细考虑对方的想法,而对方出棋时也得考虑你的想法。所以你还得想到对方在想你的想法,对方当然也知道你想到了他在想你的想法。这就形成了一个线性的推理链:我知道你知道我知道你知道……这是一种典型的博弈思维。
博弈论的基本假设:理性人
博弈论中有一个基本的假设,那就是博弈的参与者和行动者是理性的人。其中的理性是指参与者努力运用自己的推理能力使自己的利益最大化。对于这个词,有必要进行深入的阐释。
首先,理性的人一定是自利的。
所谓自利,就是追求自身利益的行为和倾向,经济学和博弈论中的自利和社会学中的自私不是一回事,在博弈论中,自利是一个中性词。博弈论假设参与者都是纯粹理陛的,他们以自身利益最大化为目标。
比如,西方政治家一般以选票数目为自己确立目标,他的理性选择就是采取最佳策略,让自己的选票数目最多,以便当选政府要员;商家一般以销售利润为自己确立目标,他们的理性选择就是运用各种方法,实现企业利润的最优化。
其次,“理性”和“道德”不是一回事。
理性的选择只是最有可能实现自己的目标,而不一定最合乎道德。理性和道德有时会发生冲突,但理性的人也不一定是不道德的。最后,“理性”和“自由”不一定一致。这一点,很多人都深有体会。小孩子对学习感到厌倦,但父母却认为只有好好学习,孩子将来才能有出息。于是,家长和孩子之间展开博弈,父母会根据孩子的行动采取各种各样的激励方案,孩子也会根据父母的行动寻找对策。这时,父母和孩子都是理性的,也都是不自由的,因为,父母的自由意愿应该是让孩子幸福快乐,但理性一点考虑,他们宁愿逼迫孩子学习。孩子的自由意愿是玩耍,但是由于知道父母会对其玩耍的行为进行惩罚,所以,理性地选择了为自己所讨厌的学习。这就是理性和自由的悖论。
当然,在现实中,理性的选择和自由的选择也有可能达成一致,这当然是最理想的状态。
理性模式的主要特征就是“目标明确”四个字,博弈的参与者十分清晰、明确地知道自己的目的,并为此而进行各种理性的选择。
点击博弈论关键词
博弈由很多因素构成,每个博弈至少都包含五个基本要素。
1.参与者
也可以称之为决策主体,或者叫局中人、博弈者。在一场竞赛或博弈中,有两个参与者的博弈现象称为“两人博弈”,而多于两个参与者的博弈现象称为“多人博弈”。博弈中的参与者是游戏中的各种角色。
比如象棋,有这样几种角色:老将、相、士、车、马、炮和小卒子,俨然一支军队。每个角色都是棋局博弈的局中人。当然,比起真实的人生,这个模型过于简单了,但一样可以映射出现实的生活。
2.策略
一局博弈中,每个参与者都有可供选择的、实际可行的、完整的行动方案,即方案不是某阶段的行动方案,而是指导整个行动的一个方案。一个参与者的一个可行的自始至终全局筹划的行动方案,称为这个参与者的一个策略。如果在一个博弈中,参与者都只有有限个策略,则称为“有限博弈”,否则称为“无限博弈”。由于在人生中每个人都随时扮演着参与者的角色,人生也就随时面对各种选择,所以在人生这场大游戏里,策略的选择也就异常重要。一旦选择不慎,则可能出现人生的败局。
3.支付
所谓支付,就是所有参与者真正关心的东西,是参与者的收益或效用,我们—般称之为得失。每个局中人在一局博弈结束时的得失,不仅与该局中人自身所选择的策略有关,而且与全局中人所取定的一组策略有关。所以,一局博弈结束时,每个局中人的“得失”是全体局中人所取定的一组策略的函数,通常称为支付函数。每个人都有自己的支付函数,在整个人生的每一步行动中,其实都为自己简单地计算过支付函数中效用的得失,也就是干—件事情值还是不值。
4.信息
在博弈中,策略选择是手段,效用是目的,而信息则是根据目的采取某种手段的依据。信息是指局中人在做出决策前所了解的关于得失函数,或支付函数的所有知识,包括其他局中人的策略选择给自己带来的收益或损失,以及自己的策略选择给自己带来的收益或损失。在策略选择中,信息自然是最关键的因素,只有掌握了信息,才能准确地判断他人和自己的行动。
两军对垒,知己知彼者必然取胜。在牌桌上,出老千的人每次都赢。公司里都有机密文件,这是商业秘密,绝不能透露,透露一点则可能给公司带来厄运。
5.均衡
均衡是一场博弈最终的结果。均衡是所有局中人选取的最佳策略所组成的策略组合。均衡是平衡的意思,在经济学中,均衡意即相关量处于稳定值。在商品市场的供求关系中,如果在某一价格下,想以此价格买此商品的人均能买到,而想卖的人均能卖出,此时我们就说,该商品的供求达到了均衡。
在上述要素中,参与者、策略、支付和信息规定了一局博弈的游戏规则。均衡是博弈的结果,也是游戏结束的最后结局。
博弈的几种基本类型
根据博弈中参与者是否了解对方的行动以便采取自己的行动,博弈可以分为静态博弈和动态博弈。
静态博弈是指参与者同时采取行动,或者尽管参与者采取的行动有先后顺序,但后行动的人不知道先采取行动的人采取的是什么行动。
举一个简单的例子。小孩子常常玩一种“剪刀、石头、布”的游戏,这就是一种静态博弈。两个小孩同时出招,出招之前,任何一方都不知道对方会出哪一招,只能根据自己的猜测或者随意选择自己的策略。这就属于静态博弈。
动态博弈是指参与者的行动有先后顺序,并且后采取行动的人可以知道先采取行动的人所采取的行动。
下面这个故事就包含了一个典型的动态博弈:
在一家小旅馆里,一位住店的男青年走入厕所。突然,一个打扮得花枝招展的女郎闪电似的跟着进了厕所,并迅速地把厕所门关上,对青年说道:“把你的钱和手表给我,不然我就喊你非礼。”
厕所里没有第三者,真相难以说清,不给钱女郎就喊非礼,弄不好会使自己声名狼藉。男青年遇此困境,并未惊慌失措,而是急中生智,用手指指自己张大的嘴巴,又指指自己的耳朵,然后“呜呜啊啊”地叫起来。
女郎见事情不顺利,便想转身溜走。此时男青年掏出钢笔递给她,并将自己的手掌伸出来,示意女郎把刚才的话写在他的手掌上。
青年这一动作如此逼真,女郎以为真的遇到了哑巴,放松了警惕。她还想继续敲诈,便拿起笔在男青年的手上写道:“把钱和手表给我,不然就喊你非礼!”
这个青年取得了女郎的罪证,便一把抓住她,大喊一声:“抓抢劫犯!”
女郎是个惯犯,每天抢劫别人,没想到今天被人抓了。
在青年与女郎的博弈过程中,先是女郎威胁青年,接着是青年急中生智装哑巴,女郎与青年这一先一后的行为就是动态博弈了。青年根据女郎的威胁策略做出了装哑巴的行动,但到这里博弈过程并未结束。动态博弈就是把博弈过程重复下去,如果是无限重复,那就是无限动态博弈,有限重复就是有限动态博弈,像平时玩的接龙游戏就属于无限动态博弈,而案例中的女郎与青年的博弈显然是个有限动态博弈。接着女郎根据小伙子的行动判断出小伙子是哑巴,然后做出在小伙子手上写字的行动,直到小伙子又做出行动策略:喊抓抢劫犯。至此,整个博弈过程结束。
从知识的拥有程度来看,博弈又可以分为完全信息博弈和不完全信息博弈。