“博古论今”
唐朝时期,有一位非常著名的政治家,叫李德裕,曾经两度为相。唐敬宗时,李德裕在担任浙西观察使时,曾经处理了一桩非常棘手的案子。当地甘露寺的住持告发前住持侵吞寺里的钱财。这位住持不仅拿出了有关文书为凭据,还找来众多僧人为其作证。前住持大呼冤枉,却又拿不出证明自己清白的证据。案子最后转到了李德裕那里。
李德裕感觉这桩案子非常可疑。这时候,有人偷偷告诉李德裕,那些证明文书都是假的,因为那些僧人对前住持不满,所以才串通起来诬陷他。可是这桩案子的人证物证俱全,要想为前住持申冤非常困难。
很快,李德裕想出了一个办法。他将作证的僧人全部叫来,逐一询问他们是否亲眼看见前住持私吞金子,大家都回答说看见了。李德裕随后把他们一个个都分开,然后给他们每人一团软黄泥,让他们捏出前住持私吞金子的形状。这些僧人之前谁也没有想到这位父母官会有这么一手。结果,作证的僧人捏出的金子造型各异,前住持也获得了清白。
实际上,这则故事中的李德裕就运用了博弈论中的囚徒困境理论。
“点睛释义”
何为囚徒困境
有两个罪犯被警察抓了起来,分别关进两个相互独立的牢房里进行审讯。在这种情形下,两个囚犯都能够做出多种选择:或是与警方合作,供出他的同伙;或是保持沉默,与警察对抗到底。两个囚犯心里很清楚,如果他们都能保持沉默的话,就都会被无罪释放。但警方也早就料定了这一点,告诉两个囚犯,如果他们中的一个人告发另外一个人,那么他就可以被无罪释放,同时还可以得到一笔不菲的奖金。而被告发的同伙就会被处以重罪,并且缴纳高额的罚款。当然,如果这两个囚犯都互相背叛的话,两个人都会被处以重罪。
这种情况下,两个囚犯该如何抉择呢?是选择共同沉默还是互相背叛?从表面上看,他们最好的方法是选择保持沉默,但他们必须考虑清楚对方可能采取何种选择。A犯对他的同伙并不信任,并且告发同伙不但能够无罪释放,还能得到不菲的奖金,这个诱惑实在太大了。但他同时也考虑到,他的同伙也会有这样的想法。所以A犯唯一理性的选择就是背叛同伙。即使B犯也根据同样的考虑向警方交代了,虽然A犯也得服刑,但起码他不必在这之上再被罚款。所以最后的结果就是这两个囚犯都选择了坐牢。这就是博弈论中著名的囚徒困境。
囚徒困境反映了一个深刻的哲学问题,个人理性和集体理性的矛盾。在这个博弈活动中,博弈双方对于对方的可能得益是完全知道的,并且彼此都能独立自主地做出策略抉择。每个博弈主体在选择自己的策略时,虽然他无法知晓对方的实际选择,但他必须考虑对方可能采取的选择,因为对方的选择会对自己的利益造成很大影响,因此他会根据对方可能的两种选择分别考虑自己的最佳策略。
囚徒困境在我们的现实生活中十分常见,其中最为熟悉的就是挤公共汽车。从集体理性的角度来看,按次序上车是最有效率的做法,但是如果你去挤而我不去挤,我就可能上的慢些,因此每个人的最佳战略都是去挤,结果上车就更慢了。虽然每一乘客采取策略都是最优的,但是结果却是最坏的,其原因就在于个人理性和集体理性的矛盾和冲突。
囚徒困境的应对策略
囚徒困境在现实社会中广泛存在,而且情形要复杂得多。比如,汽车尾气与空气质量的问题。要保持空气清洁,汽车主人就要对车安装防污染的过滤装置,需要自己负担费用。而每一个理性个体既想享受清洁的空气,又不愿为此付出代价。还有民众生育观中的多子多福与人口膨胀的问题,都存在着囚徒博弈。
要想克服囚徒困境,就要从集体成员的主观条件入手,使成员在新的基础上做出最优决策,打破原有的纳什均衡,建立新的有价值的纳什均衡(纳什均衡是经济学家纳什提出的,若有N个人参加博弈,那么在给定他人战略的情况下,在每一个参与人选择的最优战略所形成的战略组合中,没有任何一个参与人有积极性选择其他战略,也没有任何人有积极性打破这种均衡)。为此可以采取以下措施:
一方面,利用强化的作用,制定规则或提供奖惩措施,通过正强化的作用,引导决策者改变自己原有的决策偏好,向着有利于集体利益的方向发展,做出对集体而言的最优策略。
另一方面,要创造良好的文化氛围。囚徒困境说到底其实也是一种道德困境,要解决这种道德困境,就要从根本入手,创造良好的文化氛围,逐步改变全体的道德观、价值观、主观偏好。
深刻认识囚徒困境的弊端,充分利用强化手段,在良好的社会文化氛围中创造人人都能从全局的利益出发,团结合作,使全社会建立起一种新的有利于全体成员的有价值的纳什均衡。