博弈论
上QQ阅读APP看书,第一时间看更新

第4节 博弈的分类

依据不同的基准,博弈有不同的分类方式。下面就结合实例,一一介绍一下这些分类。

根据博弈的参与者之间是否有一个具有约束力的协议,博弈分为合作博弈和非合作博弈。

合作博弈并不是指参与者之间有合作的意向,或者合作态度,而是参与者之间有具有约束力的协议、约定或者契约,参与者必须在这些协议的范围内进行博弈。非合作博弈是指参与者在博弈的时候,无法达成一个对各方都有约束力的协议。

合作博弈是研究合作中如何分配利益的问题,目的是使得协议框架内所有参与者都满意。而非合作博弈的目的是如何为自己争取最大化的利益,并不考虑其他参与者的利益。

一方面来讲,合作博弈让我们认识到了合作的力量和团队的效率。但是,从另一方面来看,正是一些行业的寡头之间进行合作博弈,签订协议,强强联合,达到了对一些行业垄断的目的。垄断之后他们便协议商定产量和价格,以获取最大利益。

非合作博弈强调的是对自己利益最大化地争取,不考虑其他参与者的利益,与其他参与者之间没有共同遵守的协议。非合作博弈远比合作博弈复杂,因此人们的主要研究方向还是在非合作博弈身上。非合作博弈是博弈的常态,生活中的博弈大多是非合作博弈,没有特别说明的情况下,一般人们说的博弈都是指非合作博弈。

我们前面提到的大多数例子是非合作博弈,比如“囚徒困境”博弈中,两个犯人之间没有任何协议,没有串供,每个人都在为自己争取最大利益;空城计的博弈中诸葛亮与司马懿之间更不可能是合作博弈;还有夫妻抢各自喜欢的电视频道的博弈也是非合作博弈。

总之,合作博弈是关于合作中如何分配利益的博弈,使得参与各方之间的利益达到一种均衡;非合作博弈是为自己争取最大利益的博弈,不考虑他人的利益。

前面我们举了一个火场中逃生的例子:你在参加一个同学生日聚会的时候突然遇到了火灾,酒店只有两个安全出口。如果不考虑道德因素,你在估算两个出口离你的距离远近,以及每个出口的人流量之后,选择一个能最快逃生的出口,这便是一个非合作博弈。博弈的参与者是你与其他逃生的人,利益是最快时间逃出火灾。估算出通过哪个门逃生用时最短,并选择从这个门逃生,便是这场博弈的最优策略。

但是,如果你考虑了道德因素,没有自己逃走,而是组织大家逃生,并且让老人、孩子先走,自己最后才离开。这样的话,就不存在博弈,因为你没有考虑自己的利益,缺少博弈的要素。

如果你既没有自己逃走,也没有把机会让给别人,而是同其他逃生的人商定了一个策略,保证大家能同时逃生。这样的话,就成了一个如何在合作中分配利益的问题。这便是合作性博弈。

按照参与者选择策略、做出决定的先后顺序,博弈可以分为静态博弈与动态博弈。

如果参与者们同时选择策略,或者虽然有先后,但是后做出策略的参与者并不知道其他参与者的策略,那便是静态博弈。比如“剪子、包袱、锤”就属于静态博弈;如果参与者的行动有先后顺序,并且后者是在了解前者策略的前提下制定自己的策略,这种情况就是动态博弈,比如下象棋、打扑克。

下面我们举两个例子来说明一下静态博弈与动态博弈。

某地区要建一个大型污水处理厂,面向社会招标。几个大型的建筑公司都想承建这项工程,都向招标处发去了自己的投标意向书,其中包括各自公司对这项工程的设计和报价。竞标的截止日期是10月1号,有的公司8月就投标了,也有的9月下旬才投标。

在这场博弈中,每个投标公司之间拼的主要还是对工程的设计以及工程报价,这也是每个公司的策略。在这里,每个公司投标的时候不知道其他公司的策略,尽管有的8月份就投标了,也就是做出策略了,但是因为他的内容是对外保密的,并没有影响到后来者做出策略。尽管投标时间有先后,但是取得的效果与大家同时竞标是一样的。所以这是一场静态博弈。

说完了静态博弈,再说一下动态博弈。动态博弈的关键词是,行动有先后,后者的决策受前者的影响。下面例子中就包含着一个动态博弈:

一个年轻人在一家酒吧喝酒,中途他起身去厕所。刚进厕所,厕所的门就被一个尾随而入的女人关上了。这个女人对年轻人说:“把钱和手机拿出来给我,不然的话我就大喊,说你非礼我。”

年轻人想,此时没有第三人在场,如果她喊非礼的话,自己肯定是说不清的。但是又不能让坏人得逞,这样她就会去敲诈更多的人。年轻人急中生智,指指自己的嘴巴,又指指自己的耳朵,嘴里还“呜呜哇哇”个不停,装作是聋哑人。

这个女人发现他是个聋哑人,便准备放弃,虽然敲诈不成也不会被抓住任何把柄。但是年轻人却不满足于把她摆脱,而是想抓住证据,让她以后再也不能作案。于是,他便掏出一支笔,在手掌中写道:“你说什么?”这个女人不想放弃这次敲诈的机会,便在男人伸出的手上写道:“把钱和手机给我,不然我就喊非礼。”

年轻人一看自己抓住了对方敲诈的证据,便一把抓住女子,大声喊道:“我要送你去派出所!”女子这才发现自己上当了。

在这场博弈中,女子率先行动,使出策略,不拿出钱和手机来就喊非礼。年轻人根据当时的情形急中生智,选择了装聋作哑的策略,让对方放弃敲诈。女子见占不到便宜便选择了三十六计走为上,想要逃脱。年轻人为了抓住她的把柄,又使出策略,诱导女子留下证据。女子以为还有机会获利,便将威胁的话写到年轻人的手上,没想到中了年轻人的计。这场博弈最后的策略是年轻人使出来的,那就是掌握了证据之后,将该女子送到派出所。至此,这场博弈结束。

这其中,年轻人与女子之间使出的策略都是根据对方的策略做出的。这是一场典型的动态博弈。

信息是博弈的四大要素之一,是参与者做出准确判断的依据。但是在有的博弈中,我们能完全掌握对方的信息,还有很多时候我们并不知道,或者不完全了解对方的信息。比如在下象棋的博弈中,一方的排兵布阵都体现在对方面前,一目了然;但是打扑克的博弈中,你只知道自己手里的牌,不知道其他人手中的牌。基于对其他参与者的信息掌握程度,博弈可以分为完全信息博弈和不完全信息博弈。

完全信息博弈是指博弈中对其他参与者特征、利益、可能选择的策略等信息都有一个准确的了解。如果对其他参与者特征、利益、可能选择的策略等信息没有一个准确的了解,或者有多个参与者的情况下,只对个别参与者的信息了解,这两种情况的博弈便是不完全信息博弈。

博弈论模式中有一个“警察与小偷”模式,便是一个很经典的完全信息博弈。这个模式的大意是这样的:镇上有两处地方需要巡逻,A处有价值两万元的物品,B处有价值1万元的物品,但是镇上只有一个警察,只能选择一处巡逻。同时,镇上还有一个贼,他也只能选择去A处或者B处一处偷盗。如果警察在一处巡逻,小偷去另一处偷盗,小偷就能得逞;如果警察在一处巡逻,小偷去同一处作案,他就失败了。警察与小偷事先都不知道对方将会去哪里作案或者巡逻。试问,这种情况下,警察应该选择如何巡逻?

用我们前面介绍的博弈分类来看,这属于静态博弈,参与者双方事先都不知道对方的选择,自己策略的制定也与对方的策略无关。同时,这还是一个完全信息博弈。在这场博弈中,镇上有A、B两处地方有值钱的物品,警察只能选择一处巡逻,小偷只能选择一处下手作案,以及镇上的交通路况等等,都是双方的共同认知,这些信息对警察和小偷是公开的,因此这是一场完全信息博弈。

我们将上面这个模式改造一下,假设有一天警察想出了一个捉住小偷的好主意:传出虚假消息,声称自己晚上将去A处巡逻,但是暗中去B处蹲守。不过这一切小偷并不知道,他不知道这是警察设下的一个圈套,结果他去B处偷盗,最终被警察抓到。在这场博弈中,警察使用了声东击西的策略,但是小偷对此并不知情。此时,这场博弈便变成了不完全信息博弈。

一方获益,另一方损失,这只是博弈的一种结果。除此之外,博弈的结果还可能是两败俱伤,或者双方共赢。按照博弈的结果来分,博弈分为负和博弈、零和博弈与正和博弈。

负和博弈是指博弈的参与者最后得到的收获都小于付出,都没有占到便宜,是一种两败俱伤的博弈。

网络上流传着这样一个笑话,甲、乙两个经济学家走在路上,突然发现了路边有一坨狗屎,甲便对乙说:“你要是把它吃了,我给你5000万元。”乙一想,尽管臭了点,不过5000万元也不是个小数目啊,犹豫了半天之后还是把它吃了。

二人继续往前走,心中都有些不平衡。甲想,5000万元也不是一笔小数目,我本想开开玩笑,现在倒好,白白花了5000万元,什么也没得到。乙想,虽然得了5000万元,可吃狗屎的滋味太难受了,说不定这件事情传出去还会被人耻笑。就在这时,两人又发现了一坨狗屎。乙便提议说,你要是把它吃了,我也给你5000万元。甲本来就有点心疼自己的钱,再说乙都吃了,自己为什么不能吃?于是他便吃了。按理说,两个人又找回了心理和金钱上的平衡,但是两个人怎么想都觉得不对,谁也没有得到什么,平白无故每人吃了一坨狗屎。他们把这件事告诉了自己的导师,导师听完之后大吃一惊,说道:“你们知道自己做了什么吗?一转眼你们就创造了一个亿的GDP啊!”

虽然只是一个笑话,但是其中蕴涵着一场博弈,就结果来看是一场典型的负和博弈,也就是双方的收获都小于付出,两败俱伤。

零和博弈是指参与者中一方获益,另一方损失,并且参与者之间获得的利益与损失之和为零。赌博便是零和博弈最好的体现,只要有赢家就会有输家,赢家赢的钱与输家输的钱肯定是一样多。这与物理上的能量守恒定律是一个道理,不管能量怎样变动,总量是不变的。

我们用一个扑克牌游戏来解释一下零和博弈。甲、乙两个人玩猜扑克游戏,游戏规则是每个人随便抽一张牌,然后一起打开,若是颜色相同,甲给乙1元钱,若是颜色不同,乙给甲1元钱。为了保证没有歧义,先将牌中的“大王”和“小王”拿出来。我们假定赢了1元钱用1来表示,输了1元钱用-1来表示。我们知道,这个游戏可能出现的情形共有4种:

第一种情形:甲是红牌,乙是红牌,甲乙的得失为(-1,1)。

第二种情形:甲是红牌,乙是黑牌,甲乙的得失为(1,-1)。

第一种情形:甲是黑牌,乙是红牌,甲乙的得失为(1,-1)。

第一种情形:甲是黑牌,乙是黑牌,甲乙的得失为(-1,1)。

可以看出,无论是哪种情况,结局不外乎是一方赢1元钱,另一方输1元钱,两人之间的得失总和永远为零。这种博弈我们便称为“零和博弈”。

正和博弈又被称为双赢博弈、合作博弈,是指参与者都能获益,或者一方的收益增加并不影响其他参与者的利益,这种博弈被认为是结局最好的一种博弈,也就是双赢。

曾经有一个人想了解一下天堂和地狱到底有什么区别,他便去问传教士。传教士把他带到了一间两层楼的房子里面,一楼上有一张大餐桌,桌上摆放着各种美食,但是坐在桌子周边的人个个愁容满面。原来他们的手臂受到了诅咒,不能弯曲,每个人都无法把食物送进自己嘴里;他们又来到了二楼,二楼上同样有一张餐桌,桌上摆满了美食,桌边人的手臂同样不能弯曲,但是他们却是欢声笑语不断,吃得津津有味,原来他们既然靠自己的手吃不到自己嘴里,就与对面坐的人相互喂食。传教士便对这个人说:“你不是想知道天堂和地狱的区别吗?刚才在一楼看到的就是地狱,二楼这里便是天堂。”

这是一个很典型的双赢的例子,二楼的人们相互合作,结果每个人都得到了自己想要的,是正和博弈;而一楼的人自私自利,最后谁也没有吃到东西,是负和博弈。