“博古论今”
刘德华有一首广为传唱的歌曲——《如果你是我的传说》。这首歌把恋爱中的男女所面临的“囚徒困境”演绎得淋漓尽致。按照“囚徒困境”,开始了恋爱的一对男女,也就双双走入了“囚徒困境”。根据“囚徒困境”的原理,恋人最为明智的选择就是无论对方对自己是否忠诚,另觅新欢对自己而言都是利益最大化的选择。然而,与囚徒被分开审查不同,热恋中的两个人每天会形影不离,对彼此都会全心全意,并且信誓旦旦,其目的只有一个,就是让对方相信自己能够此情不渝。他们希望彼此忠诚,从而换来一个好的博弈结果。
那么,除了道德伦理的约束,有没有一种机制可能让爱情中的男女信守誓约呢?这就涉及重复博弈的问题。
“点睛释义”
什么是重复博弈
重复博弈是指同样结构的博弈重复多次,其中的每次博弈称为阶段博弈。以囚徒困境为例,如果囚徒的罪行较轻,每次判刑都不是很严重,那么两个囚徒在刑满释放之后再作案,作案之后再判刑,释放之后再作案,如此周而复始,他们之间进行的就是重复博弈,其中每次作案和判刑是阶段博弈。
假设甲乙二人进行博弈,甲乙均采取合作态度,双方的收益均为100元;甲合作,乙对抗,则甲的收益为0元,乙的收益为200元;甲乙二人均对抗,则双方收益均为20元。由此我们可以看到,如果双方都合作,每个人都将得到100元,而如果双方都对抗,则各自只能得到20元。那么人们为什么还会选择对抗而不是合作呢?原因就在于这是一个一次性博弈的囚徒困境——无论对方选择什么,选择对抗总是自己的最优策略。
重复博弈的特征
重复博弈是动态博弈中的重要内容,它具有以下几个基本特征:一是阶段博弈之间没有物质上的联系,也就是说,前一阶段的博弈不改变后一阶段博弈的结构;二是所有参与人都观察到博弈过去的历史,例如在每一个新的阶段的重复博弈中,两个囚徒都知道同伙在过去的每次博弈中选择了抵赖还是坦白,对于这一点,囚徒可以从自己过去的判刑轻重中发现;三是参与人关心的是整个博弈的总得益,总得益是所有阶段博弈得益的贴现值之和。
影响重复博弈均衡结构的主要因素是博弈次数和信息的完备性。因为重复次数的存在,参与人会在短期利益与长期利益之间进行权衡,他们有时会为了长期利益而暂时牺牲短期利益,这一点为现实生活中的许多合作行为和社会规范等现象提供了部分解释。信息的不完备性则可能使参与人为了自己的长远利益,而积极地建立良好的声誉。
在“重复博弈”条件下走出“囚徒困境”
囚徒的两难境地确实抓住了不信任和需要相互防范背叛这种真实的一面。但是在现实生活中,信任与合作很少达到如此两难的境地。无论在自然界还是在人类社会,合作都是一种随处可见的现象。到底是何种机制促使生物体或者人类进行相互合作呢?这是因为有重复博弈的存在。
在无限次重复博弈的情况下,合作可能是稳固的。如果博弈无穷次,双方就会逐渐从互相背叛走向互相合作。因为任何一次背叛都会招致对方在下次博弈时的报复;而双方都采取合作态度会带来合作收益。这就是“一报还一报”的策略。
另外,规则协议的约束力也很重要。如果囚徒困境只是一次性的博弈,签订协议是毫无意义的,其纳什均衡点并不会改变。囚徒困境一旦从一次性博弈转变为重复博弈,情况会发生很大变化。例如国外的黑手党组织严密,对待背叛者的惩罚是非常残忍的。一个黑手党成员告发别的黑手党成员,一定会被组织谋杀。我们假设前面的囚徒困境故事囚犯A和B都是黑手党成员。他们很可能宁愿被判处终生囚禁,也不愿意出狱之后被同伙干掉。实际上,在重复型的囚徒困境中,签订合作协议并不是很困难,困难的是这个协议对博弈各方是否具有很强的约束力。
上述囚徒困境说的是一个非常特殊的例子,它只允许这两个囚徒做一次这样的决策。如果同样的两个囚徒经过多次博弈之后,它们采取合作的态度逃避法律制裁的可能性会大大增强。重复的“囚徒困境”之所以能产生上述效果,因为它从根本上解决了几个问题,一是重复博弈使得博弈双方都在更大程度上了解了对方的信息,使得更多的私人信息变为博弈双方的公共信息;二是重复博弈使得“一报还一报”式的报复得以实现。“一报还一报”式的报复指的是博弈一方永远不先背叛对方,而且还会在下一轮中对对手的前一次合作给予回报,但它也会采取背叛的行动来惩罚对手前一次的背叛。
冲突何以能产生合作,是因为重复博弈的存在。如果双方之间的交易是一次性的,结果一定是诚信缺失。但是如果双方能够预期到交易次数会增加,那么受长期利益的驱动,就会相应增加交易双方的诚信度。因此当人们每天面对自己的对手和竞争者时,当战略情形大量重复出现时,即使个体间有直接的利益冲突,达成合作的几率也会上升。我们应该充分利用现代网络,减少信息不对称,为重复博弈创造条件,从而实现博弈者的双赢或者多赢。