登陆注册
9153900000020

第20章 最优化策略(1)

1.优势在谁手中

冯·诺伊曼认为:在一个二人零和游戏中,总会找到一种有一个明确而合乎理性的方法以获得个人的最佳收益,而这个“明确而合乎理性的方法”就是“极小极大原理”。诺伊曼的这一发现可能是博弈论最重要的核心内容。

什么是“极小极大原理”呢?用通俗一点儿的话说就是,你想赢得竞争,可能有几种选择,你当然愿意选择受益最大的一种;但是你的选择不能不考虑对方的对策,因为他跟你一样,也是这样想的,所以你就必须把对方的选择也考虑清楚。比如你有两种选择,对方也有两种选择,如果你的一种选择无论在对手作出何种对策时效果都比另外一个好,这通常被称为“优势策略”。另一方面,对手也明白你的优势策略所在,知道你会照此实行,所以也会在自己的两个对策中选择效果最好的一种——这也是他的优势策略。显然,如果双方都选择优势策略。那么这个博弈就是有迹可循、可以预测的,也就是所谓“理性的解”,并形成某种“定式”,即均衡。

比如在“囚徒困境”中,招供就是“理性的解”,因为就单方面来说,无论对方招不招供,你招供都是最佳策略,于是结果就是双方招供,这个结果其实并不好,但最可能出现,这就是“均衡”。

为什么会出现这个不好的结果呢?因为对任何一方来说,这个结果还不是最坏的一个,无论如何比自己独自受过要好。著名作家卡尔维诺一语道破:“有时候,你能指望的最佳结果就是避免最坏情况。”

我们还可以用“分蛋糕”的故事说明这个均衡:给两个小孩分一块蛋糕,谁都希望自己分到大的一块,如何解决这个矛盾呢?当然,大人可以作为仲裁者,帮助他们分,但是就算你切得再仔细,也不可能做到完全公平;而且,就算你做到完全的公平,恐怕还会有人觉得吃了亏。那么,有没有更好的办法呢?

当然有,这就是你制定一个规则——由一个人来分,而由另一个人先选择要哪一块。显然前者知道,后者的优势策略就是选择较大的那一块,所以尽可能分得公平就是他的优势策略,只有这样才可以把自己的损失降到最小。

当你身处类似“囚徒困境”这样的同时行动的博弈时,你的最佳策略是什么?决定胜负的因素又是什么?双方的策略选择住往是有迹可循的,并形成某种“定式”,即均衡。为了说明博弈如何达到“均衡”的结果,我们可以通过两份杂志,美国的《时代》和《新闻周刊》为例来演示这一过程。

每个星期,《时代》和《新闻周刊》都会暗自较劲,要做出最引人注目的封面故事。一个富有戏剧性或者饶有趣味的封面,可以吸引潜在买主的目光。因此,每个星期,《时代》的编辑们一定会举行闭门会议,选择下一个封面故事。

他们这么做的时候,很清楚在此时《新闻周刊》的编辑们也在开会,选择下一个封面故事;反过来,《新闻周刊》的编辑们也知道《时代》的编辑们正在做同样的事情……这两家新闻杂志投入了一场博弈。由于《时代》与《新闻周刊》的行动是同时进行的,双方都在毫不知晓对手的决定的情况下采取行动。不过他们都知道双方在博弈中的期望是什么,所以可以预料对方的策略选择。

要注意,这种同时进行的博弈与相继(一先一后)行动的博弈所要用到的策略思维和行动是完全不同的。对于像下棋这样的一人一步的相继行动的博弈,每个参与者都必须向前展望,估计对手的意图,从而倒后推理,决定自己这一步应该怎么走。这是一条线性的推理链:假如我这么做,他就会那么做,若是那样,我会这么反击,依此类推。也就是说,你怎么走,完全取决于对手的上一步行动。

而在同时行动的博弈里,没有一个参与者可以在自己行动之前得知另一个参与者的整个计划。在这种情况下,互动推理不是通过观察对方的策略进行,而是必须通过看穿对手的策略才能展开。要想做到这一点单单假设自己处于对手的位置会怎么做还不够。即便你那样做了,你又能发现什么?你只会发现,你的对手也在做同样的事情,即他也在假设自己处于你的位置会怎么做。因此,每一个人不得不同时扮演两个角色,一个是自己,一个是对手,从而找出双方的最佳行动方式。与一条线性的推理链不同,这是一个循环——“假如我认为他认为我认为……”诀窍在于怎样破解这个循环。

我们可以提供一个单一的、统一的原理,为相继行动的博弈确定最佳策略,就是“向前展望,倒后推理”。在这里,事情不会那么简单。

不过,关于同时行动不可少的思维方式的思考可以总结为指导行动的三个简单法则。这些法则又基于两个简单概念:优势策略与均衡。举一个简单的例子,你是一名足球前锋,你和队友形成了二打一的局面,你面对着对方的后卫,你可以选择带球突破,也可以选择传球给队友。一般情况下,传球过人的成功率更大,那么传球就是你的优势策略,即某些时候它胜于其他策略,且任何时候都不会比其他策略差。假如一个球员拥有这么一个策略,他的决策就会变得非常简单,他可以选择这个优势策略,完全不必担心其他对手怎样行事。因此,寻找优势策略是每一个人的首要任务。

回到《时代》对《新闻周刊》的例子,假定本周有两大新闻:一是国会就预算问题吵得不可开交;二是发布了一种据说对艾滋病有特效的新药。编辑在选择封面故事的时候,首先考虑的是哪一条新闻更能吸引报摊前的买主(假设无论采用哪一则新闻做封面故事,消费者都会买这本杂志)。在报摊前的买主中,假设30%的人对预算问题感兴趣,76%的人对艾滋病新药感兴趣,这些人只会在自己感兴趣的新闻变成封面故事的时候掏钱买杂志。假如两本杂志用了同一则新闻做封面故事,那么感兴趣的买主就会分为两组,一组买《时代》,另一组买《新闻周刊》。

现在,《时代》的编辑可以进行如下推理:假如《新闻周刊》采用“艾滋病新药”作封面故事,那么,假如我采用“预算问题”作封面故事,我就会得到整个“预算问题市场”(即全体读者的30%),假如我采用“艾滋病新药”,我们两家就会平分‘艾滋病新药市场’(即我会得到全体读者的35%),因此,“艾滋病新药”为我带来的收入就会超过“预算问题”。假如采用“预算问题”,那么,假如我采用同样的故事,我会得到15%的读者,假如我采用“艾滋病新药”,就会得到70%的读者;这一次,第二个方案同样会为我带来更大的收入。因此,我有个优势策略,就是采用“艾滋病新药”作封面。无论我的对手选择采用上述两个新闻当中的哪一个,我采用这一策略都会比我采用其他策略更胜一筹。

在这个博弈里,双方都有一个优势策略,也就是都选择“艾滋病新药”作为封面新闻。采用这个策略的最佳结果是获得70%的读者,最差的结果是35%,都比选择“预算问题”的30%要好。

从策略观点来看,各方均有一个优势策略的博弈是最简单的一种博弈,虽然其中存在策略互动,却有一个可以预见的结局:全体参与者都会选择自己的优势策略,完全不必理会其他人会怎么做。但这一点并不会降低参与或者思考这种博弈的趣味性。

在“囚徒困境”中,两个参与者都有一个优势策略,只不过这股压倒一切的力量最终将他们引向了一起倒霉的结局。这就提出了一个很有意思的问题:参与者怎样合作才能取得一个更好的结果?

有时候,某参与者有一个优势策略,其他参与者则没有。我们只要略微修改一下《时代》与《新闻周刊》的封面故事大战的例子,就可以描述这种情形。假设全体读者都偏向于选择《时代》,假如两个杂志选择同样的新闻做封面故事,喜欢这个新闻的潜在买主当中有60%的人选择《时代》,40%的人选择《新闻周刊》。对于《时代》,“艾滋病新药”仍然是优势策略,但对于《新闻周刊》就不再是了,因为《时代》的优势策略是选择“艾滋病新药”这条新闻,如果它也作同样选择,那么只能得到28%的读者,小于选择“预算问题”的30%。

换言之,《新闻周刊》的最佳选择不再与《时代》的策略无关。假如《时代》选择“艾滋病新药”,《新闻周刊》选择“预算问题”就能得到更大的销量。《新闻周刊》的编辑们不会知道《时代》的编辑们将会选择什么,不过他们可以分析出来。因为《时代》有一个优势策略,那一定就是他们的选择。因此《新闻周刊》的编辑们可以很有把握地假定《时代》已选了“艾滋病新药”,并据此选择自己的最佳策略,即“预算问题”。

由此可见,只有一方拥有优势策略的博弈其实也非常简单。拥有优势策略的一方将采用其优势策略,另一方则针对这个策略采用自己的最佳策略。

现在,既然我们已经介绍了优势策略的概念,就有必要强调两点特征,这两点特征可以用来确定什么不是优势策略。人们很容易就会弄错,不知道优势策略的优势究竟是对什么而言的。“优势策略”的“优势”是说,无论你的对手采用什么策略,你的这个策略与你的其他策略相比都占有优势,而不是与你的对手的策略相比占有优势。

某个参与者如果采用优势策略,就能使自己获得比采用任何其他策略更好的结果。回顾“封面大战”的例子,《时代》和《新闻周刊》都有一个优势策略,但双方都不可能得到比对方更高的销量。

另一个常见的误解在于,一个优势策略必须满足一个条件,即采用优势策略得到的最坏结果也要比采用另外一个策略得到的最佳结果略好。在前面讲到的例子里,所有优势策略凑巧都满足这个条件。按照最初设定的条件,《时代》假如采用“艾滋病新药”作封面故事,最坏的结果是得到35%的市场份额;他们若采用“预算问题”作封面故事,可能得到的最佳结果是30%的市场份额。但这并非优势策略的一个普遍特征。

现在让我们想象一下《时代》和《新闻周刊》之间爆发了一场价格战。假设每本杂志的制作成本是1美元,且售价只有两个可能的选择,分别是3美元(意味着每本利润为2美元)和2美元(意味着每本利润为1美元)。假设顾客永远倾向于选择价格较低的杂志,且在杂志价格相同的时候两种杂志各得一半读者。杂志定价3美元的时候,读者总数是500万;如果杂志价格降到2美元,因为价格便宜,市场会有一定扩展,读者总数将升到800万。这时你可以轻易算出《时代》在四种可能出现的价格组合里将会获得多少利润,即如果双方杂志价格都是3美元,利润都是500万;一方降价至2美元,则独得800万,另一方分文不得;如果双方都降,每一方利润都是400万。

有点像“囚徒困境”是不是?的确,在“囚徒困境”中,双方的优势策略都是招供,在这里则都是降价。

《时代》的优势策略是定价2美元(《新闻周刊》亦如此)。《时代》采用这个优势策略可能得到的最坏结果是赢利400万美元。但是,采用另外一个策略可能得到的最佳结果将超过这一数字,达到500万美元。问题是比较这两个数字毫无意义。500万美元的数字是在两本杂志同时定价3美元的时候出现的;不过,假如这时《时代》把价格降到2美元,利润还会更高,达到800万美元。

我们可以把这些例子归纳为一个指导同时行动的博弈的法则。即:假如你有一个优势策略,请照办,不要担心你的对手会怎么做。

假如你没有一个优势策略,但你的对手有,那么就权当他会采用这个优势策略,相应选择你自己最好的做法。

提醒一句:我们已经确立了同时行动的博弈的优势策略的概念,若是换了相继行动的博弈,采用优势策略的时候就要格外留神。因为策略互动的本质已经改变,优势策略的概念也会完全不同。假设我们说你有一个优势策略,无论你的对手选择怎么做,你按照这个策略做都比采用其他策略更好;若是相继行动,而你的对手先行,你就应该一直选择自已的优势策略。

正如我们已经说过的那样,这是你对你的对手每一个行动的最佳对策,因此也是对现在他选择的这个特定行动的最佳对策。但是,假如你先行,你就不会知道你的对手将会采取什么行动。他会观察你的选择,同时作出自己的决定,因此你有机会影响他的行动。某些情况下,若是采用优势策略以外的策略,你可能更有效地施加这种影响。

2.追求最好的

不是所有博弈都有优势策略,哪怕这个博弈只有一个参与者。实际上,优势与其说是一种规律,不如说是一种例外。虽然出现一个优势策略可以大大简化行动的规则,但这些规则却并不适用于大多数现实生活中的博弈。这时候我们必须用到其他原理。

一个优势策略优于任何其他策略,同样,一个劣势策略则劣于任何其他策略。假如你有一个优势策略,你可以选择采用,并且知道你的对手若是有一个优势策略他也会照办;同样,假如你有一个劣势策略,你应该避免采用,并且知道你的对手若是有一个劣势策略他也会规避。

同类推荐
  • 打动人心的108个交际技巧(教你成功丛书)

    打动人心的108个交际技巧(教你成功丛书)

    一个擅于交际的人,往往会受到很多人的喜欢,在各种场合下办起事情来,也会如鱼得水,因为人们常常会愿意帮助自己喜欢的人。有的人认为自己性格内向,不擅交际,常常担心自己做错事说错话。本书旨在向你展示切实可行的交际绝招,让你在人际关系中能够游刃有余,成为真正的交际高手。
  • 不一样的经典阅读不一样的人生智慧

    不一样的经典阅读不一样的人生智慧

    本书秉承经典新读的创意理念,站在时代的角度审视历史,将经典中的精华充分发掘,让传统与现代在另类的解读中完美融合。运用新的思维对过去的经典进行新的加工,可以使经典具有时代新意。鲁迅先生就曾经根据神话故事,将其所在时代的现实生活,运用独特的时代思维写成了《故事新编》,从某种意义上讲,这就是我国神话经典的“另类演绎”。用新的形式对过去的经典进行新的演绎,使其在继承原有经典精髓的基础上,成就新的经典,是本书的初衷。这不是一本简单的文学读物,它汇集经典的人生智慧,讲述先进的教育理念,指点人生迷津。它适合每一个人静心细品,无论是稚嫩单纯的孩子,还是热血沸腾的青年,抑或是年长深沉的老人。
  • 因为疼痛 所以珍惜

    因为疼痛 所以珍惜

    因为青春,所以会痛,因为疼痛,所以要珍惜……人生是一场没有尽头的漂泊,有时候一千滴眼泪,才能换回一次微笑。每个人的青春都有各自的特色,然而每个青春都少不了创伤、疼痛,如何在现实中找准自己的位置?如何面对生活的疼痛苦楚?我们在生活中应该承担什么样的责任?这本书有关疼痛,有关青春,有关梦想,着力从生活的细微之处探寻人生的哲理,启发我们不断改变思维角度,用智慧来解决问题,坚定信念,沿着梦想前进。是写给还在疼痛中挣扎的年轻人的正能量之书。
  • 习惯关乎成败

    习惯关乎成败

    好的习惯是一种坚持、坏的习惯是一种惰性。习惯就是这样一种力量,它决定着人生的成败。成败的分寸之间,习惯决定一切。坚持一个行动,你会养成一个习惯;坚持一个习惯,你会养成一个个性;坚持一个个性,决定你一生的成败。本书就像一面镜子,让你清晰地检查身上种种以前视而不见的坏习惯,教你怎样跨越人生的障碍,为你个人事业的发展提供指导,重新定位你自己新的生活,明晰自己人生的方向。并帮助你在年轻时就具备走向成功人生的优秀素质,为你送上一把开启成功之门的金钥匙。
  • 解码大前研:箴言录

    解码大前研:箴言录

    本书不仅仅从经营管理、工作经验、思维方式谈大前研一那种从高处俯瞰社会的种种经验,还从社会理念、政治态度、民众情绪来谈论他的对当今社会上各种现象的观点,甚至还谈到他对待家庭与教育、休闲与享受的各方面的体验。
热门推荐
  • 我是我还是我是她

    我是我还是我是她

    一觉睡醒,变成了6年后的自己,身边多了一个让自己感到神秘的丈夫,父母,朋友,一切似乎都已经回不到原点...
  • 造星者之女经纪人

    造星者之女经纪人

    为了帮姐姐维持她的工作室,徐荷嫵卖掉了自己的房子;被段磊带进娱乐圈之后,毅然选择了经纪人的职业,凭着自己敏锐的观察和持之以恒的耐力,旗下的艺人发展越发顺利。纪阡逸是她第一位艺人,参与了她往后许多年的人生,两人的合作一直默契十足,却没想到在这看似平静的合作中却暗藏风波。
  • 最后一个教室

    最后一个教室

    迷雾中的身影渐渐靠近,似人的轮廓却有着恶鬼般的气息。最后一个教室仍开着灯,是谁在朗读的声音像葬礼的丧钟。能够逃脱吗,生命的倒计时现在开始。
  • 眼角伊人

    眼角伊人

    于灵熙看着自己的名字和陆辛的名字,总觉得俩人之间的名字有种微妙的联系。**高中生涯:“我喜欢上陆辛了。”于灵熙心生情愫,脸颊染上了绯红。方雨橙知道后大惊,“真的吗,真好啊。”【你是我的精神支柱】**大学:“你一直以为我不喜欢你?”陆辛挑眉。“咳,我,我也没说我喜欢你啊。”于灵熙装作矜持道。谁知男主大大狠狠抱住了女主!本文:女主一厢情愿-男女主互相暗恋-后来——根据真实生活改编的青春校园小说“重磅来袭”。眼角伊人=我暗恋的那位意中人。
  • 学渣的高中进行时

    学渣的高中进行时

    对于学霸来说高中是在书海中遨游、在试卷上奋斗、在白天奋笔疾书、在晚上挑灯夜读……学渣的高中生活又是怎么样的呢?
  • 每天10分钟销售课

    每天10分钟销售课

    谨以《每天10分钟销售课》先给那些不甘于平庸,不怕失败,用于坚持,渴望改变人生、成就辉煌的销售员们。 1分钟问题导入、3分钟案例阅读、3分钟经典解析、3分钟精心铭记,每天只需10分钟,帮你完成一次销售技能的迅速提升。
  • 一符生死门

    一符生死门

    最隐秘的门派,最牛逼的弟子,人敬我一尺我敬人一丈,得罪我,让你生不如死!
  • 银河法师

    银河法师

    死神总是与她擦肩,所经过之地都已沦陷,最后的家园还能守住吗?那传承了无数轮回的设计图到底设计了什么?翻遍了历史的尘埃,依稀飘来的是他的警告:“炼狱将至,百战无生。”——这是一个寻找答案的故事,两个主角,两条线。——这不是爽文,想看装逼打脸金手指开挂无敌的请去看辰东。
  • 毒妃:谋倾天下

    毒妃:谋倾天下

    她是21世纪某组织的试毒人,天生冷漠,却无法孑然一身。一朝穿越,她成了青国将军府的痴傻三小姐。任人欺凌,命该如此?呵呵,安沁玥放肆一笑。教训目中无人的小妹,她游刃有余。反击心狠手辣的庶母,她乐在其中。无所谓阴谋阳谋,她来者不拒。本以为这辈子可以清闲度日,却不曾想既定的命运无法改变。青国先祖曾预言,武帝三百年,有女安沁玥,将可倾覆天下。她一笑置之,却有人暗中打起算盘。身怀异能,所有的生物为她所控。血液含毒,百毒不侵。不停地强大自己,却也只是为了......
  • 穿越之王爷别追

    穿越之王爷别追

    出生红旗下,长在新中国,不迷信不盲信,可是谁尼玛告诉我穿越是什么鬼?穿越就算了,可这男的是谁?老跟着我算怎么回事?老娘两辈子还没谈过恋爱,初吻都被你夺走了,还要我负责是几个意思?