第20章 共同进化(5)
冯·诺依曼最感兴趣的是想看看自己能否给这种互动游戏找出最理想的策略,因为乍一看来,它们在理论上几乎是无解的。于是他提出了博弈论作为解答。位于加利福尼亚州圣塔莫妮卡市的兰德公司是美国政府资助的智库。那里的研究人员发展了冯·诺依曼的工作,最后列出了四种有关相互猜测游戏的基本变体。每一个变体各有不同的输赢或平局的奖励结构。这四个简单的游戏在技术文献中统称为“社会困境”,但又可以被看作是构造复杂共同进化游戏的四块积木。这四个基本变体是:草鸡博弈、猎鹿博弈、僵局,以及囚徒困境。
“草鸡博弈”是供鲁莽的青少年玩的游戏。两辆赛车朝悬崖边奔去;后摔出来的司机是赢家。“猎鹿”是一群猎手面对的难题,他们必须合作才能把鹿杀死,如果没有人合作的话,那么开小差各自去撵兔子会更好些。他们是在赌合作(高回报)还是背叛(低,但是肯定有回报)吗·“僵局”是挺无聊的游戏,彼此背叛收益最高。最后一个“囚徒困境”最有启发性,在1960年代末成为两百多例社会心理学实验的测试模型。
“囚徒困境”是由兰德公司的梅里尔·弗勒德〔梅里尔·弗勒德(Merrill Flood,1912~):1935年在内布拉斯加大学获数论硕士学位,同年获普林斯顿大学哲学博士学位。曾在普林斯顿大学、美国陆军部、兰德公司、哥伦比亚大学、密歇根大学、加利福尼亚大学等处任职,曾任美国管理科学学会会长、美国运筹学学会会长,以及工业管理工程师协会副会长。——译自“维基百科”〕于1950年设计出来的。游戏中,两个分别关押的囚犯必须独立决定否认还是坦白罪行。如果两人都认罪,那么两人都会受到惩罚。如果两人都否认的话,则都会被无罪释放。但假如只有一人认罪,那么他就会得到奖励,而另一个则受到惩罚。合作有回报,但如果策略奏效的话,背叛也有回报。你该怎么办呢?
如果只玩一次,背叛对手是最合理的选择。但当两个“囚徒”一次又一次地玩,从中相互学习——也即“重复的囚徒困境”——游戏的推演就发生了变化。你不能无视对手玩家的存在;不论是作为强制的敌手还是同伙,他都必须受到重视。这种紧密相连的共同命运与政敌之间、生意对手之间或者生态共生体之间的共同进化关系非常类似。随着对这个简单游戏的研究的进一步深入,问题变成了:要想在长期内取得高分,面对“重复的囚徒困境”应该采取什么样的策略?还有,同无情或友善的各类玩家对垒时,该采取什么样的策略更容易取得成功呢?
1980年,密歇根大学政治学教授罗伯特·阿克塞尔罗德〔罗伯特·阿克塞尔罗德(Robert Axelrod):密歇根大学政治学与公共政策教授,美国科学院院士,著名的行为分析及博弈论专家。〕组织了一次锦标赛,征集了14条不同的用于“囚徒困境”的对策,以循环赛的形式看哪个对策最后胜出。最后获胜的是一个最简单的对策,叫做“一报还一报”,由心理学家阿纳托尔·拉普伯特〔阿纳托尔·拉普伯特(Anatol Rapoport,1911.05.22~2007.01.20):出生在俄罗斯的美籍犹太裔数学家和心理学家。主要贡献有统摄系统理论、数学生物学、社会相互影响的数学模式,以及随机感应模型。〕设计。“一报还一报”是往复型策略,它以合作回报合作,以背叛回报背叛,往往产生一轮轮合作的周期。阿克塞尔罗德发现,重复游戏能产生一次性游戏所不具备的“未来阴影”之效果,这种效果鼓励合作,因为对玩家来说,用现在对他人予以的合作来换取今后他人给予的合作是一个合理的选择。合作的闪现使阿克塞尔罗德陷入沉思:“没有中央集权的自我主义世界需要具备什么条件才能涌现出合作的行为?”
1651年,托马斯·霍布斯〔托马斯·霍布斯(Thomas Hobbes,1588~1697):英国政治学家、哲学家。英国理性主义传统的奠基人。〕宣称:只有在善意的中央集权帮助下才能产生合作。这一传统政治推论曾经在几个世纪里一直被奉为圭臬。霍布斯断言,没有自上而下的管理,就只会有群体自私。不管经济体制如何,必须有强大的势力来推行政治利他主义。然而,在美国独立和法国革命后逐步建立起来的西方民主制度表明,民意通达的社会可以在没有中央集权强力干预的情况下发展合作机制。个人利益也能孕育出合作。在后工业化经济里,自发合作是常有的事情。被广泛采用的工业标准(既有质量方面的,也有协议方面的,如110伏电压,还有ASCII码),以及因特网这个世界上最大的无政府形态的兴起,都使得人们更加关注孕育共同进化合作所需的必要条件。
这种合作不是新时代的精神至上主义。相反,如阿克塞尔罗德所说,这是一种“不讲交情、无需远见的合作”——是大自然的冷规则,适用于许多层面,并催生了自组织结构。不管你愿不愿意,多少都得合作。
“囚徒困境”这类游戏,不单只人类,任何自适应个体都可以玩。细菌,犰狳,或是计算机里的半导体器件,都可以根据各种回报机制,在眼前的稳妥收获与未来的高风险高回报之间做出权衡。当长时间与相同的伙伴一起玩这个游戏时,双方既是在博弈,又是在进行某种类型的共同进化。
每一个复杂的自适应组织都面临着基本的权衡。生物必须在完善现有技能、特质(练腿力以便跑得更快)与尝试新特质(翅膀)之间作取舍。它不可能同时做所有的事情。这种每天都会碰到的难题便属于在开发和利用之间作权衡。阿克塞尔罗德用医院作了一个类比:“一般情况下你可以想见试用某种新药比尽可能发掘已有成药的疗效回报来得低。但假如你给所有病人用的都是目前最好的成药,你就永远无法验证新药的疗效。从病人个人角度来讲最好不要试用新药。但从社会集合体的角度出发,做实验是必要的。”开发(未来收益)与利用(目前稳赢的筹码)之比应该是多少,这是医院不得不作的博弈。生命有机体为了跟上环境的变化,在决定应该在多大程度上进行变异和创新时,也会作出类似的权衡。当海量的生物都在做着类似的权衡并且互相影响时,就形成一个共同进化的博弈游戏。