第5章 纳什均衡(1)
谁都不能改变策略
著名经济学家保罗·萨缪尔森有句至理名言:“你可以将一只鹦鹉训练成经济学家,因为它所需要学习的只有两个词:供给与需求。”
后来,博弈论专家坎多瑞引申说:“这只鹦鹉要成为现代经济学家,还必须再多学一个词:纳什均衡。”
爱心护天才——纳什的传奇生活
1994年诺贝尔经济学奖授予了三位对博弈论作出奠基性贡献的学者:美国数学家纳什、美国经济学家约翰·海萨尼和德国波恩大学教授莱茵哈德·泽尔腾。这标志着博弈论已经成为了现代经济学的一个重要组成部分。
大名鼎鼎的纳什是普林斯顿大学数学系塔克教授的学生。现在凡博弈论著作都必讲的囚徒困境,就出于塔克教授在斯坦福大学的一次讲演。他的学生纳什则从囚徒困境中得到启发,发展得出了在博弈论中占据核心位置的“纳什均衡”。
纳什的一生富有传奇色彩。在1950年7月13日纳什22岁生日那天,他获得了数学哲学博士学位,1957与来自萨尔瓦多的阿丽莎结了婚,第二年他们回到麻省理工学院,纳什得到了终身职位。纳什不到30岁就已经名闻遐迩,曾被美国著名的《财富》杂志推举为同时活跃在纯数学和应用数学两个领域的天才数学家中最杰出的人物、美国最耀眼的科学新星。
可在盛名的顶峰,在学术生涯向巅峰攀升的大好年华,病魔袭击了纳什,纳什患了妄想性精神分裂症。这使他在以后的生活里,长期饱受着思维与情绪错乱的困扰,偏执型精神分裂症使他几乎成为一个废人。从1959年开始,他上课的时候会语无伦次,演讲的时候会说一些毫无意义的内容。因为实在无法继续工作,纳什辞去了在麻省理工学院的教职。
纳什完全被病魔所控制,往昔才华横溢的天才少年,变成了一个衣着怪异、喜欢在黑板上乱写乱画留下些稀奇古怪的信息、热衷于给政治人物写一些奇怪的信、游荡在普林斯顿大学数学系和物理学系所在的范氏大楼的、满怀忧伤的幽灵。
但在亲人、朋友的照顾和普林斯顿人们的呼唤下,经历了长期病痛折磨的纳什竟然在20世纪80年代奇迹般地康复了。他不但可以与人正常交谈,而且还能够灵活使用在被精神分裂症折磨的30年里不断更新换代的计算机。
差不多就在这个时候,纳什成为了1985年经济学诺贝尔奖候选人,但是最终没能获奖。究其原因,与说是因为瑞典皇家科学院对他贡献的认识尚且不足,还不如说是人们对他当时的心智状态仍存有疑虑,毕竟纳什因精神病不能工作是众所周知的事实。而获奖者又必须到瑞典首都斯德哥尔摩面对国王和王后向瑞典皇家科学院发表一篇通俗、得体的答辞。人们担心那时神志还不完全清醒的纳什做不到这一点。此外,获奖者总得有个头衔才说得过去,而恰恰在那时,纳什什么都没有。
当岁月的年轮驶近1994年的时候,博弈论获奖的势头开始上涨,是瓜熟蒂落的时候了。但纳什此时还是什么头衔也没有。在这个紧要关口,出于同一师门的纳什的同学、普林斯顿大学数学系和经济学系著名数理经济学家库恩教授发挥了特殊的作用。
库恩等人向诺贝尔委员会申明,如果因为身体状况就剥夺纳什当之无愧的诺贝尔奖,那实在需要过分的勇气。待库恩等人的坚持有了初步的正面回应后,库恩又向普林斯顿大学数学系建议,给予了纳什“访问研究合作者”的身份。库恩教授的所有努力没有白费,纳什终于在1994年走上了诺贝尔经济学奖的领奖台。
纳什的故事还被美国好莱坞搬上了银幕——《美丽心灵》。该影片是一部以纳什的生平经历为基础而创作的人物传记片,获得了许多电影奖项,几乎包揽了当年电影界的全球最高奖项。感兴趣的读者可以看看这部感动心灵的好莱坞经典电影,通过电影你可以对纳什有更全面、更理性的了解。
为什么肯德基和麦当劳紧紧相邻?
社会、政治、经济等各个领域的任何一次博弈最终总会形成一个结果,达到一种平衡,比如一件衣服在买卖双方的讨价还价后成交,这个成交价就是买方与卖方的平衡点。这样的结果被称为纳什均衡。
纳什均衡又称为非合作博弈均衡,是由美国数学家纳什提出的一种最常见的、也是最重要的博弈均衡。它是博弈论中第一个重量级的概念。纳什均衡主要描述了博弈参与者的这样一种均衡:在这一均衡下,每个参与者都确信,任何一方单独改变策略,偏离目前的均衡位置,都不会得到好处。
为了进一步说明纳什均衡的意义,我们可以日常生活中一些司空见惯的现象为例进行阐述。
在每个大大小小的城市街道上,我们经常会见到这么一个大家都很熟悉的现象:某一地段上的商店十分拥挤,形成了一个繁荣的商业中心区,但另一些地段却十分冷僻,没什么商店。再仔细观察,你还会发现一个更有意思的现象:往往同类型的商家总是聚集在一起,比如肯德基、麦当劳两家百年老店紧紧相邻;沃尔玛、家乐福相隔不远,相依为伴;安利、雅芳隔路而望……这是什么缘故呢?纳什均衡理论就能够对这些现象做出科学的解释。让我们看一个快餐店定位博弈的例子。
假设有一条笔直的公路,公路上每天行驶着大量来往的车辆,并且车流量在公路上是均匀分布的。现在设想有两家快餐店A、B要在这条公路上选择一个位置开张,招揽来往车辆。他们所卖的东西口味差不多,价格也相当。那么,两家快餐店开在公路的哪个具体位置好呢?
为了分析的需要,我们要对该模型作一个合乎逻辑的假定:因为食物口味相近,价格也无多大悬殊,车辆司机到哪个快餐店购买食物,仅仅取决于哪个快餐店距离自己比较近。反正东西、价格都一样,何必舍近求远呢。根据这个原则,两个快餐店应该怎样确定自己最后的位置呢?
也许你马上会说把这条公路从0到1四等分,快餐店A设在1/4的位置,快餐店B设在3/4的位置,不就是最好的策略选择吗?的确,从资源的最佳配置来看,这种均匀散布的情况是最优的,每家快餐店都拥有1/2的顾客量。同时,对于开车的司机来说,这种策略的敲定,会使司机到快餐店的总距离最短,可大大缩短吃饭时间。
然而,人生不如意事十之八九,天并不总能遂人之愿。快餐店老板做为当代生意人,自然是精明之至的,用经济学术语来说,就是他们具有绝对的经济理性。只要手段合法,他们总是希望自己的顾客尽可能地多,生意尽可能地红火,至于其他人的生意好坏则与自己无关。也就是说,任何一家快餐店老板肯定不会考虑另一家快餐店生意的好坏和车辆司机的方便,而只会以自己赢利为目的,这就决定了他们都不会安于1/4、3/4这样的位置安排。
出于这种理性考虑,A快餐店的老板会想:如果我将快餐店的位置从1/4点处稍微向中间的1/2点处移一点,那么我的势力范围就会比先前所定的位于1/4点处那种方案要大。相应的,B快餐店的地盘就会缩小,我肯定会从B快餐店夺取部分顾客,生意会更红火。这对于A快餐店单方面来说无疑是一个好主意。所以,原来位于1/4点处的A快餐店就有了向1/2点处移动来扩大自己地盘的激励。
当然,B快餐店的老板也不甘示弱,做为一个经济理性人,他也会有将自己的快餐店从3/4点处向中间的1/2点处移动的激励,好扩大自己的地盘,争取更多的顾客。可见,原来A快餐店在1/4处、B快餐店在3/4处的配置并不是稳定的配置。
那么,两家快餐店究竟移到哪个位置上才是稳定的位置呢?不难想象,在两个快餐店定位的市场竞争博弈中,位于1/4点处的A快餐店要向中间的1/2点处靠,位于3/4点处的B快餐店也要向中间的1/2点处挤,双方博弈的最后结局将是两家快餐店设置在位于中点的l/2附近的位置,两家相依为邻且相安无事地做自己的快餐生意。这是纳什均衡的位置。
如果不是两家快餐店,而是很多家快餐店,也很容易对其进行分析得到结果:这些快餐店仍然会在公路的1/2点处附近设店以达到纳什均衡。因为在这个位置上,不管哪家快餐店只要是单独移开一点,就会丧失1/2点的市场份额,所以谁都不会偏离中点的位置。
开头所说的一些日常生活中大家都熟悉的现象的原因,现在可以说是十分明了了吧。只要承认只关心自己眼前商业利益的理性人假设,且条件许可,那么同类型的商家将几乎趋向于相依为邻,挤在中点就是唯一稳定的策略选择和唯一的纳什均衡。这也完全可以看做是公正的市场竞争的合理结果。这就是很多城市商业中心形成的原理。
读者可能会说,实际生活中的情况似乎并不全是这样。当然也有例外的,但那一定是其他因素作用的结果。
一种可能是中点位置的房租特别高,根据成本-收益分析,靠近中点位置所争取的顾客带来的利润抵不上高出房价的那部分支出,觉得不划算。再一种可能是两家快餐店都服从于一个协调机构,协调机构从方便司机就餐的角度考虑,希望两家快餐店互相礼让,分别设在1/4处和3/4处的位置开张。还有一种极特殊的可能,就是两家快餐店实际上是同一个总店的两家分店,肥水不流外人田,他们当然会选在1/4处和3/4处的位置上。
混合策略的力量——该去哪里巡逻,抽签决定吧!
是不是所有博弈均存在一个前面我们所说的纯策略(纯策略是指参与者在其策略空间中选取的唯一确定的策略)的纳什均衡点呢?答案是否定的。除了上面叙说多次的、大家比较熟悉的纯策略均衡点外,有的博弈并没有一个确定的唯一的策略,而会存在一个混合策略(混合策略是指参与者采取的不是确定的唯一的策略,而是在其策略空间上的概率分布)均衡点。下面我们将以警察与小偷的博弈为例对混合策略均衡点进行说明。
某小镇只有一名巡逻警察,他一个人要负责整个镇的治安秩序。假定该小镇主要分为A、B两区,A区有一家建设银行,B区有一家金银首饰店。再假定这个小镇有一个小偷,要对该镇实施偷盗行为。因为没有分身术,警察一次只能在一个区巡逻;而对于小偷来说,一次也只能去一个地方行窃。