博弈论
上QQ阅读APP看书,第一时间看更新

第一章 博弈论入门

第1节 什么是博弈论:从“囚徒困境”说起

一天,警局接到报案,一位富翁被杀死在自己的别墅中,家中的财物也被洗劫一空。经过多方调查,警方最终将嫌疑人锁定在杰克和亚当身上,因为事发当晚有人看到他们两个神色慌张地从被害人的家中跑出来。警方到两人的家中进行搜查,结果发现了一部分被害人家中失窃的财物,于是将二人作为谋杀和盗窃嫌疑人拘留。

但是到了拘留所里面,两人都矢口否认自己杀过人,他们辩称自己只是路过那里,想进去偷点东西,结果进去的时候发现主人已经被人杀死了,于是他们便随便拿了点东西就走了。这样的解释不能让人信服,再说,谁都知道在判刑方面杀人要比盗窃严重得多。警察决定将两人隔离审讯。

隔离审讯的时候,警察告诉杰克:“尽管你们不承认,但是我知道人就是你们两个杀的,事情早晚会水落石出的。现在我给你一个坦白的机会,如果你坦白了,亚当拒不承认,那你就是主动自首,同时协助警方破案,你将被立即释放,亚当则要坐10年牢;如果你们都坦白了,每人坐8年牢;都不坦白的话,可能以入室盗窃罪判你们每人1年,如何选择你自己想一想吧。”同样的话,警察也说给了亚当。

一般人可能认为杰克和亚当都会选择不坦白,这样他们只能以入室盗窃的罪名被判刑,每人只需坐1年牢。这对于两人来说是最好的一种结局。可结果会是这样的吗?答案是否定的,两人都选择了招供,结果各被判了8年。

事情为什么会这样呢?杰克和亚当为什么会做出这样“不理智”的选择呢?其实这种结果正是两人的理智造成的。我们先看一下两人坦白与否及其结局的矩阵图:

当警察把坦白与否的后果告诉杰克的时候,杰克心中就会开始盘算坦白对自己有利,还是不坦白对自己有利。杰克会想,如果选择坦白,要么当即释放,要么同亚当一起坐8年牢;要是选择不坦白,虽然可能只坐1年牢,但也可能坐10年牢。虽然(1,1)对两人而言是最好的一种结局,但是由于是被分开审讯,信息不通,所以谁也没法保证对方是否会选择坦白。选择坦白的结局是8年或者0年,选择不坦白的结局是10年或者1年,在不知道对方选择的情况下,选择坦白对自己来说是一种优势策略。于是,杰克会选择坦白。同时,亚当也会这样想。最终的结局便是两个人都选择坦白,每人都要坐8年牢。

上面这个案例就是著名的“囚徒困境”模式,是博弈论中最出名的一个模式。为什么杰克和亚当都选择了对自己最有利的策略,最后得到的却是最差的结果呢?这其中便蕴涵着博弈论的道理。

博弈论是指双方或者多方在竞争、合作、冲突等情况下,充分了解各方信息,并依此选择一种能为本方争取最大利益的最优决策的理论。

“囚徒困境”中杰克和亚当便是参与博弈的双方,也称为博弈参与者。两人之所以陷入困境,是因为他们没有选择对两人来说最优的决策,也就是同时不坦白。而根本原因则是两人被隔离审讯,无法掌握对方的信息。所以,看似每个人都做出了对自己最有利的策略,结果却是两败俱伤。

我们身边的很多事情和典故中也有博弈论的应用,我们就用大家比较熟悉的“田忌赛马”这个故事来解释一下什么是博弈论。

齐国大将田忌,平日里喜欢与贵族赛马赌钱。当时赛马的规矩是每一方出上等马、中等马、下等马各一匹,共赛三场,三局两胜制。由于田忌的马比贵族们的马略逊一筹,所以十赌九输。当时孙膑在田忌的府中做客,经常见田忌同贵族们赛马,对赛马的比赛规则和双方马的实力差距都比较了解。这天田忌赛马又输了,非常沮丧地回到府中。孙膑见状,便对田忌说:“明天你尽管同那些贵族们下大赌注,我保证让你把以前输的全赢回来。”田忌相信了孙膑,第二天约贵族赛马,并下了千金赌注。

孙膑为什么敢打保证呢?因为他对这场赛马的博弈做了分析:双方都派上等、中等、下等马各一匹,田忌每一等级的马都比对方同一等级的马慢一点,因为没有规定出场顺序,所以比赛的对阵形式可能有六种,每一种对阵形式的结局是很容易猜测的:

第一种情况:上等马对上等马,中等马对中等马,下等马对下等马。结局:三局零胜。

第二种情况:上等马对上等马,下等马对中等马,中等马对下等马。结局:三局一胜。

第三种情况:中等马对上等马,上等马对中等马,下等马对下等马。结局:三局一胜。

第四种情况:中等马对上等马,下等马对中等马,上等马对下等马。结局:三局一胜。

第五种情况:下等马对上等马,上等马对中等马,中等马对下等马。结局:三局两胜。

第六种情况:下等马对上等马,中等马对中等马,上等马对下等马。结局:三局一胜。

六种对阵形式中,只有一种能使田忌取胜,孙膑采取的正是这一种。赛前孙膑对田忌说:“你用自己的下等马去对阵他的上等马,然后用上等马去对阵他的中等马,最后用中等马去对阵他的下等马。”比赛结束之后,田忌三局两胜,赢得了比赛。田忌从此对孙膑刮目相看,并将他推荐给了齐威王。同样的马,只是调整了出场顺序,便取得截然相反的结果。这里边蕴涵着博弈论的道理。

在田忌赛马这个故事中,田忌同齐国的贵族便是博弈的双方,也称为博弈的参与者。孙膑充分了解了各方的信息,也就是比赛的规则与各匹马之间的实力差距,并在六种可以选择的策略中帮田忌选择了一个能争取最大利益的策略,也就是最优策略。所以说,这是一个很典型的博弈论在实际中应用的例子。

在这里还要区分一下博弈与博弈论的概念,以免搞混。它们既有共同点,又有很大的差别。

“博弈”的字面意思是指赌博和下围棋,用来比喻为了利益进行竞争。自从人类存在的那一天开始,博弈便存在,我们身边也无时无刻不在上演着一场场博弈。而博弈论则是一种系统的理论,属于应用数学的一个分支。可以说博弈中体现着博弈论的思想,是博弈论在现实中的体现。

博弈作为一种争取利益的竞争,始终伴随着人类的发展。但是博弈论作为一门科学理论,是1928年由美籍匈牙利数学家约翰·冯·诺依曼建立起来的。他同时也是计算机的发明者,计算机在发明最初不过是庞大、笨重的算数器,但是今天已经深深影响到了我们生活、工作的各个方面。博弈论也是如此,最初冯·诺依曼证明了博弈论基本原理的时候,它只不过是一个数学理论,对现实生活影响甚微,所以没有引起人们的注意。

直到1944年,冯·诺依曼与摩根斯坦合著的《博弈论与经济行为》发行出版。这本书的面世意义重大,先前冯·诺依曼的博弈理论主要研究二人博弈,这本书将研究范围推广到多人博弈;同时,还将博弈论从一种单纯的理论应用于经济领域。在经济领域的应用,奠定了博弈论发展为一门学科的基础和理论体系。

谈到博弈论的发展,就不能不提到约翰·福布斯·纳什。这是一位传奇的人物,他于1950年写出了论文《n人博弈中的均衡点》,当时年仅22岁。第二年他又发表了另外一篇论文《非合作博弈》。这两篇论文将博弈论的研究范围和应用领域大大推广。论文中提出的“纳什均衡”已经成为博弈论中最重要和最基础的理论。他也因此成为一代大师,并于1994年获得诺贝尔经济学奖。后面我们还会详细介绍纳什其人与“纳什均衡”理论。

经济学史上有三次伟大的革命,它们是“边际分析革命”“凯恩斯革命”和“博弈论革命”。博弈论为人们提供了一种解决问题的新方法。

博弈论发展到今天,已经成了一门比较完善的学科,应用范围也涉及各个领域。研究博弈论的经济学家获得诺贝尔经济学奖的比例是最高的,由此也可以看出博弈论的重要性和影响力。2005年的诺贝尔经济学奖又一次颁发给了研究博弈论的经济学家,瑞典皇家科学院给出的授奖理由是“他们对博弈论的分析,加深了我们对合作和冲突的理解”。

那么博弈论对我们个人的生活有什么影响呢?这种影响可以说是无处不在的。

假设,你去酒店参加一个同学的生日聚会,当天晚上他的亲人、朋友、同学、同事去了很多人,大家都玩得很高兴。可就在这时,外面突然失火,并且火势很大,无法扑灭,只能逃生。酒店里面人很多,但是安全出口只有两个。一个安全出口距离较近,但是人特别多,大家都在拥挤;另外一个安全出口人很少,但是距离相对远。如果抛开道德因素来考虑,这时你该如何选择?

这便是一个博弈论的问题。我们知道,博弈论就是在一定情况下,充分了解各方面信息,并做出最优决策的一种理论。在这个例子里,你身处火灾之中,了解到的信息就是远近共有两个安全门,以及这两个门的拥挤程度。在这里,你需要做出最优决策,也就是最有可能逃生的选择。那应该如何选择呢?

你现在要做的事情是尽快从酒店的安全门出去,也就是说,走哪个门出去花费的时间最短,就应该走哪个门。这个时候,你要迅速地估算一下到两个门之间的距离,以及人流通过的速度,算出走哪个门逃生会用更短的时间。估算的这个结果便是你的最优策略。

这样的案例在我们身边有很多。2003年2月2日,哈尔滨天潭酒店发生火灾,共造成33人死亡,10人受伤。当时,偌大一个酒店就只有两个安全通道。2008年9月22日,深圳一家舞厅发生火灾,当时舞厅里面有三四百人,大家都抢着从狭窄的出口逃生,最终导致踩踏事件的发生,事故中共死亡43人,受伤59人。令人痛心的是,舞厅虽设有消防通道,但是只有几十个人选择从消防通道逃生。

不仅仅是火灾中,我们身边无时无刻不上演着一场场博弈,有博弈的地方就用得到博弈论。