登陆注册
9153900000020

第20章 最优化策略(1)

1.优势在谁手中

冯·诺伊曼认为:在一个二人零和游戏中,总会找到一种有一个明确而合乎理性的方法以获得个人的最佳收益,而这个“明确而合乎理性的方法”就是“极小极大原理”。诺伊曼的这一发现可能是博弈论最重要的核心内容。

什么是“极小极大原理”呢?用通俗一点儿的话说就是,你想赢得竞争,可能有几种选择,你当然愿意选择受益最大的一种;但是你的选择不能不考虑对方的对策,因为他跟你一样,也是这样想的,所以你就必须把对方的选择也考虑清楚。比如你有两种选择,对方也有两种选择,如果你的一种选择无论在对手作出何种对策时效果都比另外一个好,这通常被称为“优势策略”。另一方面,对手也明白你的优势策略所在,知道你会照此实行,所以也会在自己的两个对策中选择效果最好的一种——这也是他的优势策略。显然,如果双方都选择优势策略。那么这个博弈就是有迹可循、可以预测的,也就是所谓“理性的解”,并形成某种“定式”,即均衡。

比如在“囚徒困境”中,招供就是“理性的解”,因为就单方面来说,无论对方招不招供,你招供都是最佳策略,于是结果就是双方招供,这个结果其实并不好,但最可能出现,这就是“均衡”。

为什么会出现这个不好的结果呢?因为对任何一方来说,这个结果还不是最坏的一个,无论如何比自己独自受过要好。著名作家卡尔维诺一语道破:“有时候,你能指望的最佳结果就是避免最坏情况。”

我们还可以用“分蛋糕”的故事说明这个均衡:给两个小孩分一块蛋糕,谁都希望自己分到大的一块,如何解决这个矛盾呢?当然,大人可以作为仲裁者,帮助他们分,但是就算你切得再仔细,也不可能做到完全公平;而且,就算你做到完全的公平,恐怕还会有人觉得吃了亏。那么,有没有更好的办法呢?

当然有,这就是你制定一个规则——由一个人来分,而由另一个人先选择要哪一块。显然前者知道,后者的优势策略就是选择较大的那一块,所以尽可能分得公平就是他的优势策略,只有这样才可以把自己的损失降到最小。

当你身处类似“囚徒困境”这样的同时行动的博弈时,你的最佳策略是什么?决定胜负的因素又是什么?双方的策略选择住往是有迹可循的,并形成某种“定式”,即均衡。为了说明博弈如何达到“均衡”的结果,我们可以通过两份杂志,美国的《时代》和《新闻周刊》为例来演示这一过程。

每个星期,《时代》和《新闻周刊》都会暗自较劲,要做出最引人注目的封面故事。一个富有戏剧性或者饶有趣味的封面,可以吸引潜在买主的目光。因此,每个星期,《时代》的编辑们一定会举行闭门会议,选择下一个封面故事。

他们这么做的时候,很清楚在此时《新闻周刊》的编辑们也在开会,选择下一个封面故事;反过来,《新闻周刊》的编辑们也知道《时代》的编辑们正在做同样的事情……这两家新闻杂志投入了一场博弈。由于《时代》与《新闻周刊》的行动是同时进行的,双方都在毫不知晓对手的决定的情况下采取行动。不过他们都知道双方在博弈中的期望是什么,所以可以预料对方的策略选择。

要注意,这种同时进行的博弈与相继(一先一后)行动的博弈所要用到的策略思维和行动是完全不同的。对于像下棋这样的一人一步的相继行动的博弈,每个参与者都必须向前展望,估计对手的意图,从而倒后推理,决定自己这一步应该怎么走。这是一条线性的推理链:假如我这么做,他就会那么做,若是那样,我会这么反击,依此类推。也就是说,你怎么走,完全取决于对手的上一步行动。

而在同时行动的博弈里,没有一个参与者可以在自己行动之前得知另一个参与者的整个计划。在这种情况下,互动推理不是通过观察对方的策略进行,而是必须通过看穿对手的策略才能展开。要想做到这一点单单假设自己处于对手的位置会怎么做还不够。即便你那样做了,你又能发现什么?你只会发现,你的对手也在做同样的事情,即他也在假设自己处于你的位置会怎么做。因此,每一个人不得不同时扮演两个角色,一个是自己,一个是对手,从而找出双方的最佳行动方式。与一条线性的推理链不同,这是一个循环——“假如我认为他认为我认为……”诀窍在于怎样破解这个循环。

我们可以提供一个单一的、统一的原理,为相继行动的博弈确定最佳策略,就是“向前展望,倒后推理”。在这里,事情不会那么简单。

不过,关于同时行动不可少的思维方式的思考可以总结为指导行动的三个简单法则。这些法则又基于两个简单概念:优势策略与均衡。举一个简单的例子,你是一名足球前锋,你和队友形成了二打一的局面,你面对着对方的后卫,你可以选择带球突破,也可以选择传球给队友。一般情况下,传球过人的成功率更大,那么传球就是你的优势策略,即某些时候它胜于其他策略,且任何时候都不会比其他策略差。假如一个球员拥有这么一个策略,他的决策就会变得非常简单,他可以选择这个优势策略,完全不必担心其他对手怎样行事。因此,寻找优势策略是每一个人的首要任务。

回到《时代》对《新闻周刊》的例子,假定本周有两大新闻:一是国会就预算问题吵得不可开交;二是发布了一种据说对艾滋病有特效的新药。编辑在选择封面故事的时候,首先考虑的是哪一条新闻更能吸引报摊前的买主(假设无论采用哪一则新闻做封面故事,消费者都会买这本杂志)。在报摊前的买主中,假设30%的人对预算问题感兴趣,76%的人对艾滋病新药感兴趣,这些人只会在自己感兴趣的新闻变成封面故事的时候掏钱买杂志。假如两本杂志用了同一则新闻做封面故事,那么感兴趣的买主就会分为两组,一组买《时代》,另一组买《新闻周刊》。

现在,《时代》的编辑可以进行如下推理:假如《新闻周刊》采用“艾滋病新药”作封面故事,那么,假如我采用“预算问题”作封面故事,我就会得到整个“预算问题市场”(即全体读者的30%),假如我采用“艾滋病新药”,我们两家就会平分‘艾滋病新药市场’(即我会得到全体读者的35%),因此,“艾滋病新药”为我带来的收入就会超过“预算问题”。假如采用“预算问题”,那么,假如我采用同样的故事,我会得到15%的读者,假如我采用“艾滋病新药”,就会得到70%的读者;这一次,第二个方案同样会为我带来更大的收入。因此,我有个优势策略,就是采用“艾滋病新药”作封面。无论我的对手选择采用上述两个新闻当中的哪一个,我采用这一策略都会比我采用其他策略更胜一筹。

在这个博弈里,双方都有一个优势策略,也就是都选择“艾滋病新药”作为封面新闻。采用这个策略的最佳结果是获得70%的读者,最差的结果是35%,都比选择“预算问题”的30%要好。

从策略观点来看,各方均有一个优势策略的博弈是最简单的一种博弈,虽然其中存在策略互动,却有一个可以预见的结局:全体参与者都会选择自己的优势策略,完全不必理会其他人会怎么做。但这一点并不会降低参与或者思考这种博弈的趣味性。

在“囚徒困境”中,两个参与者都有一个优势策略,只不过这股压倒一切的力量最终将他们引向了一起倒霉的结局。这就提出了一个很有意思的问题:参与者怎样合作才能取得一个更好的结果?

有时候,某参与者有一个优势策略,其他参与者则没有。我们只要略微修改一下《时代》与《新闻周刊》的封面故事大战的例子,就可以描述这种情形。假设全体读者都偏向于选择《时代》,假如两个杂志选择同样的新闻做封面故事,喜欢这个新闻的潜在买主当中有60%的人选择《时代》,40%的人选择《新闻周刊》。对于《时代》,“艾滋病新药”仍然是优势策略,但对于《新闻周刊》就不再是了,因为《时代》的优势策略是选择“艾滋病新药”这条新闻,如果它也作同样选择,那么只能得到28%的读者,小于选择“预算问题”的30%。

换言之,《新闻周刊》的最佳选择不再与《时代》的策略无关。假如《时代》选择“艾滋病新药”,《新闻周刊》选择“预算问题”就能得到更大的销量。《新闻周刊》的编辑们不会知道《时代》的编辑们将会选择什么,不过他们可以分析出来。因为《时代》有一个优势策略,那一定就是他们的选择。因此《新闻周刊》的编辑们可以很有把握地假定《时代》已选了“艾滋病新药”,并据此选择自己的最佳策略,即“预算问题”。

由此可见,只有一方拥有优势策略的博弈其实也非常简单。拥有优势策略的一方将采用其优势策略,另一方则针对这个策略采用自己的最佳策略。

现在,既然我们已经介绍了优势策略的概念,就有必要强调两点特征,这两点特征可以用来确定什么不是优势策略。人们很容易就会弄错,不知道优势策略的优势究竟是对什么而言的。“优势策略”的“优势”是说,无论你的对手采用什么策略,你的这个策略与你的其他策略相比都占有优势,而不是与你的对手的策略相比占有优势。

某个参与者如果采用优势策略,就能使自己获得比采用任何其他策略更好的结果。回顾“封面大战”的例子,《时代》和《新闻周刊》都有一个优势策略,但双方都不可能得到比对方更高的销量。

另一个常见的误解在于,一个优势策略必须满足一个条件,即采用优势策略得到的最坏结果也要比采用另外一个策略得到的最佳结果略好。在前面讲到的例子里,所有优势策略凑巧都满足这个条件。按照最初设定的条件,《时代》假如采用“艾滋病新药”作封面故事,最坏的结果是得到35%的市场份额;他们若采用“预算问题”作封面故事,可能得到的最佳结果是30%的市场份额。但这并非优势策略的一个普遍特征。

现在让我们想象一下《时代》和《新闻周刊》之间爆发了一场价格战。假设每本杂志的制作成本是1美元,且售价只有两个可能的选择,分别是3美元(意味着每本利润为2美元)和2美元(意味着每本利润为1美元)。假设顾客永远倾向于选择价格较低的杂志,且在杂志价格相同的时候两种杂志各得一半读者。杂志定价3美元的时候,读者总数是500万;如果杂志价格降到2美元,因为价格便宜,市场会有一定扩展,读者总数将升到800万。这时你可以轻易算出《时代》在四种可能出现的价格组合里将会获得多少利润,即如果双方杂志价格都是3美元,利润都是500万;一方降价至2美元,则独得800万,另一方分文不得;如果双方都降,每一方利润都是400万。

有点像“囚徒困境”是不是?的确,在“囚徒困境”中,双方的优势策略都是招供,在这里则都是降价。

《时代》的优势策略是定价2美元(《新闻周刊》亦如此)。《时代》采用这个优势策略可能得到的最坏结果是赢利400万美元。但是,采用另外一个策略可能得到的最佳结果将超过这一数字,达到500万美元。问题是比较这两个数字毫无意义。500万美元的数字是在两本杂志同时定价3美元的时候出现的;不过,假如这时《时代》把价格降到2美元,利润还会更高,达到800万美元。

我们可以把这些例子归纳为一个指导同时行动的博弈的法则。即:假如你有一个优势策略,请照办,不要担心你的对手会怎么做。

假如你没有一个优势策略,但你的对手有,那么就权当他会采用这个优势策略,相应选择你自己最好的做法。

提醒一句:我们已经确立了同时行动的博弈的优势策略的概念,若是换了相继行动的博弈,采用优势策略的时候就要格外留神。因为策略互动的本质已经改变,优势策略的概念也会完全不同。假设我们说你有一个优势策略,无论你的对手选择怎么做,你按照这个策略做都比采用其他策略更好;若是相继行动,而你的对手先行,你就应该一直选择自已的优势策略。

正如我们已经说过的那样,这是你对你的对手每一个行动的最佳对策,因此也是对现在他选择的这个特定行动的最佳对策。但是,假如你先行,你就不会知道你的对手将会采取什么行动。他会观察你的选择,同时作出自己的决定,因此你有机会影响他的行动。某些情况下,若是采用优势策略以外的策略,你可能更有效地施加这种影响。

2.追求最好的

不是所有博弈都有优势策略,哪怕这个博弈只有一个参与者。实际上,优势与其说是一种规律,不如说是一种例外。虽然出现一个优势策略可以大大简化行动的规则,但这些规则却并不适用于大多数现实生活中的博弈。这时候我们必须用到其他原理。

一个优势策略优于任何其他策略,同样,一个劣势策略则劣于任何其他策略。假如你有一个优势策略,你可以选择采用,并且知道你的对手若是有一个优势策略他也会照办;同样,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。

同类推荐
  • 品格的力量(经典励志文丛)

    品格的力量(经典励志文丛)

    《品格的力量》是到目前为止世界上最受欢迎的做人处世书。全书围绕着“品格”这个话题,阐述了塑造高尚人格的最要性。在当今这个物欲横流的时代,一个拥有高尚品格的人,必将是一个受到广泛欢迎的人,而他的未来,包括人生发展、事业发展,也必将因为他的品格优异,而步入坦途。书中作者极力刻画描写杰出的人物,将他们优秀、高贵的品格淋漓尽致地展现在读者眼前,而且还表达了作者自己的理解和感悟,充分地传授他的经验,力求给读者心灵的震撼,塑造高贵的品格,把握好人生的每一步。
  • 感恩·三文鱼的生命旅程

    感恩·三文鱼的生命旅程

    本书分为八章,收录了《毕业的礼物》、《感恩之心》、《死亡玫瑰》、《真心无价》、《风中的红腰带》、《母亲的谎言》、《特殊的表白》、《赤脚之爱》、《苹果树和人生》、《信任的力量》、《上帝的礼物》等故事。
  • 哈佛口才课

    哈佛口才课

    哈佛大学有着全世界最为出色的沟通学大师霍莉·威克斯、谈判专家巴泽曼;哈佛学生的人际关系心理测评、话语艺术测评的分值都远远高出美国其他同类学府的学生。
  • 受益一生的心灵智慧:心灵鸡汤全集

    受益一生的心灵智慧:心灵鸡汤全集

    本书由200多个发人深省的隽永故事和心灵感悟组成,共分为八辑:失去也是一种获得、该停下脚步时就停下、心灵的快乐比什么都重要、没有谁注定就是弱者、努力了就会有希望、关爱别人就是关爱自己、真爱是最美的风景、生命因感动而美丽等。
  • 哲理荟萃

    哲理荟萃

    歌德说:“名言集和格言集是社会上最大的财宝——只要懂得在适当的场合把前者带进会话里,在适当的时间唤起对后者的记忆。”我们人类社会那些出类拔萃的名家巨人,在推动人类社会向前不断发展的同时,也给我们留下了宝贵的物质财富。他们通过自身的体验和观察研究,还给我们留下了许多有益的经验和感悟,他们将其付诸语言表达出来,被称之为名言或格言,其中蕴含并闪耀着智慧的光芒,成为世人宝贵的精神财富。
热门推荐
  • 拐卖童徒:师父你咋又忘了

    拐卖童徒:师父你咋又忘了

    言珏这厮,原本日子清闲,每天喝喝小茶,修修仙。可自从收了个徒弟,日子发生了翻天覆地的变化。“师父~师父~我要喝奶奶~”小小的苏梓心睁着一双圆润的大眼睛忽闪忽闪地看着他。“好,为师去取,乖哈~”再后来,苏梓心那本该离开之人,被言珏竭力保下。人人道她废柴,却不想她天赋异人。再后来,徒弟莫名修为大增,天上掉下个郁哥哥……这一切的一切是巧合还是天意?听说十世情缘,最后一世定当开花结果,言心,漫漫仙途,为师伴你可好?
  • tfboys之遇见平凡的你

    tfboys之遇见平凡的你

    我,不知道什么时候闯进你的生活,打乱你的生活秩序。我,在你出现后改变了自己!我从来没想过会遇见你,我要感谢老天爷,是他让你在的生活里一直存留。我,平凡;你,高贵,我们也许不是一个轨道的,但我们却可以改变轨道,无论有多远,我们都会在一起的。
  • 穿越之血武破天

    穿越之血武破天

    穿越之血武破天血脉进化,战天斗地武技一出,无人能及通过血脉祭坛连接天地,沟通世界获取血脉,经过修炼武气获得实力。林涛穿越同名世家少爷,却没想到一来就被驱逐出家族了,家族中人心思险恶用空间传送将他传送出去,在空间隧道中遭遇空间风暴却被系统所救。在得知在这个世界完成任务成为最强者后就可以超脱世界回归后,且看林涛如何在个世界成神、成圣成为最强者超脱世界回归。
  • 洛镜之殇

    洛镜之殇

    ‘’呜呜,洛儿,你好残忍!“”咦,对呀,你怎么知道我小名叫残忍?““嗷嗷嗷嗷,主银我饿了!!”“滚一边儿去!还有,刚才谁说我家洛儿残忍?”“~(>_<)~你俩表打起来啊!!”他,桀骜不驯,玩世不恭;她,冷酷无情,古灵精怪;在这异世,掀起滔天波澜!
  • 墨祠

    墨祠

    墨祠,墨祠,水墨的祠堂,宛如每个人的生活一般,一笔一勾勒,一点一幅画,美好却平淡
  • 神座联盟

    神座联盟

    这里是星座的世界,没有斗气,没有魔法,没有修真,没进化,没有热武器。这里只有星座,每一个星座代表着一个人,这是属于星座的时代,太阳之灵永照这片大地星座。
  • 嗜血虐杀

    嗜血虐杀

    男主角转入乌野高校,调查班里人的底戏。一个接一个的陷害,一个一个的挑衅。男主都一一解决。
  • 太极英雄传

    太极英雄传

    主人公杨露禅(公元1700年—1872年)字露禅,别号禄缠,名福魁,直隶永年县人,年轻时慕河南温县陈氏拳名,往投陈长兴门下学太极拳。他天资颖异,秉性坚毅,终于尽得陈氏拳法之秘,次与陈家诸徒较量武功,皆败之,师惊其才,遂飞授秘术。数年后,以能避强制硬之力见长,“柔中寓刚,绵里藏针。人称“治绵拳”。后至京师,任旗营武术教习,名震朝野,有“杨无敌”之称。曾与董海川较手,名望极高。其子班候、健候,自幼秉父教,均卓然成为名拳家。
  • 三生花雨,半世流漓

    三生花雨,半世流漓

    当年,他是因爱上魔界女子而被囚禁寒渊千年的青丘帝后之子;她是被养育在天界怀香林的天帝之女。他入她梦,她情根深种,跌跌撞撞一番之后,她救他重现于世,她却因逃离天界,扰乱妖族而被罚禁闭锁仙牢六百年;经年之后,他是妖界至尊青丘狐君,目若冰霜心似雪,最美是他,最无情亦是他;她是看守怀香林的上仙,为君消得人憔悴,最暖是她,最痴情亦是她;“花婈,你可知,世上最伤人的,便是执念……”“只要白漓平安无事就好!”为助他渡劫,她甘受雷刑之苦;为守在他身边,她甘愿剔除仙骨,修为尽毁;她以为她所做的一切都值得,她所有的幻想,在他与另一女子准备共结连理那刻,支离破碎。“白漓,若我还能有来生,你可愿,爱我一次。”
  • 英魂之刃之时空流失

    英魂之刃之时空流失

    文章主要讲了西门飞雪穿越后怎样和当年的伙伴回到未来