矩阵对策就是两人有限零和对策,两个局中人的赢得之和总是等于零,即对策双方的利益是激烈对抗的,一人的赢是建立在另一人的输基础之上的。“齐王赛马”就是一个矩阵对策的例子,齐王和田忌各有6个策略,一局对策结束后,齐王的赢得必为田忌的损失,反之亦然。
由于假设两个局中人都是理智的,所以每个局中人都必须考虑到对方会设法使自己的赢得最少,谁都不能存在侥幸心理。“理智行为”就是从最坏处着想,去争取尽可能好的结果。
二、无鞍点的矩阵对策
通过上面的讨论可知,求解矩阵对策的第一步应该是找出对策的鞍点,但有些矩阵对策并不存在鞍点,亦即对策没有平衡局势。
我们称此对策为没有鞍点的对策,或称对策在纯策略下没有解。
下面我们由下例来说明这种对策的特点。
该矩阵对策在纯策略意义下没有解。这时,用最大最小原则来选取双方的纯策略都不会是稳定的,在这种情况下,局中人甲的最大最小策略和局中人乙的最小最大策略都不具有“最优”的性质。因为每个局中人可以选取另外的策略来改善自己的赢得值。在本例中,如果用最大最小原则,局中人甲应选取a2,如果局中人乙想到甲会采用a2,则乙就会采用b2,甲考虑到这点就会想到采用a1,乙想到甲可能采用a1,就会考虑采用b1来对付,在乙采用b1时,甲就要选取a2,等等。
在上述情况下,双方都不能固定采用任何一个纯策略,也就是说两局中人都没有自己的最优纯策略(对策没有鞍点)。他们必须考虑随机地选取自己的策略(混合使用自己的各个策略),使对方捉摸不到自己使用的策略。
同样,局中人乙只取y1=14时,才能保证他的支出不多于52,所以,局中人甲以概率12选取a1,以概率12选取a2;局中人乙以概率14选取b1,以概率34选取b2参加对策,双方都会得到满意的结果。也就是说X=12,12和Y=14,34是局中人甲和乙的最优混合策略,(X, Y)是对策在混合策略下的解,52是相应的对策值。
从上面的例子可以看出,对于没有鞍点的对策,每个局中人参加对策时,不是决定用哪一个纯策略,而是决定用多大概率选择每一个纯策略,以这样一种方式选取纯策略参加对策是双方的最优策略。
“案例”
“非典”疫情扩散和防治
2003年4月,流行性非典型肺炎从广东省通过输入性病例的传播进入北京。在华北地区“非典”疫情爆发初期,由于没有有效地进行预防和控制,疫情迅速扩散和蔓延,疫情很快就开始在更广泛的区域内传播开来。这种局面的出现,和SARS具有极强的传染性有关,也与我们的防治工作不力有关。由于政府的监管力度不够,少数医生逃避责任,医院之间也产生一种互相推诿病人的博弈关系。随着疫情的发展,中央政府采取果断措施,加强了领导和监管力度,逐步扭转了这种不利的局面。
1.疫情爆发初期的情况
在北京爆发SARS疫情的初期,重症患者出现致死,给医护人员尤其是临时护工们增添了巨大恐惧,许多人临阵脱逃,以至于出现把月薪从350元增长到4000元也找不到一个护工的怪现象。个别医院怕自己的医护人员感染和影响单位经济效益,拒收“非典”患者,部分医护人员逃避责任,擅自离开工作岗位,致使病人到处求医,成为流动的传染源,感染“非典”的非北京籍病人离京返乡,造成疫情的更大规模扩散。
当时情况下,由于对“非典”缺乏科学的认识,政府对其严重性认识不足,没有采取有效的防治措施,对医院也没有建立严格有效的监管体制。医院面对的局面是一种囚徒困境式的博弈问题。我们按照当时的情形建立。
可见,(拒收,拒收)为一个平衡解,医院A、医院B都拒收病人,致使带着SARS病菌的病人四处求医,造成疫情扩散,对人民的健康和生命安全造成巨大威胁,从而影响到整个社会的稳定。
2.疫情防治
在疫情发展过程中,随着对SARS的逐步了解,政府及时总结经验教训,迅速出台一系列措施和规定来扭转当时的不利局面,如施行首诊负责制,对拒收发热病人的医院严惩不贷。如果医院不收治非典病人和疑似病人,那么将受到严厉的惩罚和面临强大的舆论压力。