第21章 共同进化(6)
阿克塞尔罗德发起的、有14位玩家参与的“囚徒困境”循环锦标赛是在电脑上进行的。1987年,阿克塞尔罗德通过设定一套系统拓展了这个电脑游戏。在系统里,有一小群程序玩家执行随机产生的“囚徒困境”策略。每个随机策略在和所有其它运行中的策略对阵一圈之后被打分,得分最高的策略在下一代的复制率最高,于是最成功的策略便得以繁衍和传播。许多策略都是通过“捕食”其他策略来取胜的,因而,只有当猎物能存活时,这些策略才能兴旺发达。这就导出了自然界荒野中俯拾皆是的生物数量呈周期性波动的机理,说明了狐狸和兔子的数量在年复一年的共同进化的循环中是如何起起落落的。兔子数量增,狐狸繁殖多;狐狸繁殖多,兔子死翘翘。但是没有了兔子,狐狸就得饿死。狐狸数量少了,兔子数量就多了。兔子多了,狐狸也就多了,以此类推。
1990年,在哥本哈根尼尔斯波尔研究院工作的克里斯蒂安·林德格雷〔克里斯蒂安·林德格雷(Kristian Lindgren):从事复杂系统和物质能源理论的研究。目前是威尼斯的欧洲生活科技中心主任。〕将这个共同进化实验的玩家数扩展到一千,同时引入随机干扰,并使这个人工共同进化过程可以繁衍到三万世代之后。林德格雷发现,由众多参与“囚徒困境”游戏的愚钝个体所组成的群体不但重现了狐狸和兔子数量的生态波动,也产生出许多其他自然现象,如寄生、自发涌现的共生共栖,以及物种间长期稳定的共存关系等,就如同一整套生态系统。林德格雷的工作让一些生物学家兴奋不已,因为在他的漫长回合博弈游戏中出现了一个又一个的周期。每个周期的持续时间都很长;而在一个周期内,由不同策略的“物种”所形成的混合维持着非常稳定的状态。然而,这些盛世都被一些突发、短命的不稳定插曲所打断,于是旧的物种灭绝,新的物种生根。持新策略的物种间迅速达成新的稳定,又持续发展数千代。这个模式与从早期化石里发现的进化的常见模式相契合,该模式在进化论业界里叫做间断平衡〔间断平衡论(punctuated equilibrium):1972年由美国古生物学家N.埃尔德雷奇和S.J.古尔德提出后,在欧美流传颇广。认为新种只能以跳跃的方式快速形成;新种一旦形成就处于保守或进化停滞状态,直到下一次物种形成事件发生之前,表型上都不会有明显变化;进化是跳跃与停滞相间,不存在匀速、平滑、渐变的进化。〕,或简称为“蹦移(punk eek)”。
这些实验得出了一个了不起的结果,令所有希望驾驭共同进化力量的人都为之瞩目。这是众神的另一条律法:在一个饰以“镜子上的变色龙”式的叠套花环的世界里,无论你设计或演变出怎样高妙的策略,如果你绝对服从它,为它所用,从进化的角度来看,这个策略就无法与其他具竞争力的策略相抗衡。也即是说,如何在持久战中让规则为你所用才是一个具竞争力的策略。另一方面,引入少许的随机因素(如差错、缺陷)反而能够在共同进化的世界里缔造出长久的稳定,因为这样一来某些策略无法被轻易地“山寨”,从而能够在相对长的时期里占据统治地位。没有了干扰——即出乎意料或是反常的选择——就没有足够多的稳定周期来维持系统的发展,逐步升级的进化也就失去了机会。错误能使共同进化关系不致因为胶着太紧而陷入自沉的漩涡,从而保持共同进化的系统顺流前行。向你的错误致敬吧。
在电脑中进行的这些共同进化游戏还提供了另外的教益。零和与非零和游戏的区别是少数几个渗透到大众文化中的博弈论理念之一。象棋、选举、赛跑和扑克是零和游戏:赢家的收益取自输家的损失。自然界的荒野、经济、思维意识、网络则属于非零和游戏:熊的存在并不意味狼獾会失败。共同进化中的冲突环环相扣、彼此关联,意味着整体收益可以惠及(有时殃及)所有成员。阿克塞尔罗德告诉我,“来自博弈论最早也是最重要的洞见之一就是,非零和游戏的战略内涵与零和游戏的战略内涵截然不同。零和游戏中对他人的任何伤害都对你有好处。在非零和游戏中,你们可能共荣,也可能同衰。我认为,人们常用零和游戏的观点看世界,其实他们本不该这样。他们常说:“我比别人做得好,所以我就该发达。”而在非零和游戏里,尽管你比别人做得好,你也可能和他一样潦倒。”
阿克塞尔罗德注意到,作为赢家,“一报还一报”策略从不琢磨利用对手的策略——它只是以其人之道还治其人之身。在一对一的对决中,该策略并不能胜过任何一个其他策略;但在非零和游戏中,它却能够在跟许多策略对抗的过程中取得最高累积分,从而夺得锦标。正如阿克塞尔罗德向“囚徒困境”的始作俑者威廉·庞德斯通〔威廉·庞德斯通(William Poundstone):美国作家、怀疑论者。曾在美国麻省理工学院学习物理,现居洛杉矶。长期为《纽约时报》、《经济学人》等知名报刊以及美国一些电视台撰稿。迄今已出版著作十余部,其中《循环的宇宙》、《推理的迷宫》获普利策奖提名。〕指出的:“这个理念太不可思议了。下棋时怎么可能不击败任何一个对手就夺得锦标呢?”但是在共同进化中——变化是响应自身而变化——不用打击他人就能赢。企业界那些精明的首席执行官们现在也承认,在网络和结盟的时代,公司犯不着打击他人就可以大把地赚钱。这个就是所谓的双赢。
双赢是共同进化模式下生命所演绎的故事。
坐在堆满书籍的办公室里,罗伯特·阿克塞尔罗德还沉浸在对共同进化的理解和思考中。然后他补充道:“希望我在合作进化方面的工作有助于避免世界冲突。你看过国家科学院给我的奖状没有,”他指着墙上的一块牌匾说,“他们认为它有助于避免核战争。”尽管冯·诺依曼是发展原子弹的关键人物,但他并没有将他的理论明确地应用于核军备竞赛的政治游戏。在1957年冯·诺依曼逝世之后,军事战略智囊团开始利用他的博弈论分析冷战,冷战中两个相互为敌的超级大国带有共同进化关系中“强制合作”的意味。戈尔巴乔夫具有基本的共同进化洞察力。阿尔塞德罗说,“他看到,减少而不是增加坦克数量会让苏联更安全。他单方面裁掉了一万辆坦克,使得美国和欧洲更难有借口保持大规模的军事预算,借此全面展开了结束冷战的进程。”
对于“伪神们”〔伪神:这里应当是指人类。〕来说,从共同进化中获得的最有用的教训就是,在共同进化的世界里,控制和保密只能帮倒忙。你无法控制,而开诚布公比遮遮掩掩效果更好。“在零和游戏中你总想隐藏自己的策略,”阿克塞尔罗德说。“但在非零和游戏中,你可能会将策略公之于众,这样一来,别的玩家就必须适应它。”戈尔巴乔夫的策略之所以有效,是因为他公开实施了这个策略;如果只是秘密地单方面削减武器则会一事无成。
镜子上的变色龙是一个完全开放的系统。无论是蜥蜴还是玻璃,都没有任何秘密。盖亚的大封闭圈里循环不断,是因为其中所有的小循环都在不断的共同进化沟通中互相交流。从苏联指令式计划经济的崩溃中我们了解到,公开的信息能够保持经济的稳定和增长。
共同进化可以看作是双方陷入相互传教的网络。共同进化的关系,从寄生到结盟,从本质上来讲都具有信息的属性。稳步的信息交流将它们焊接成一个单一的系统。与此同时,信息交流——无论是侮辱、还是帮助,抑或只是普通新闻——都为合作、自组织,以及双赢结局的破土发芽开辟了园地。
在我们刚刚迈入的网络时代中,频繁的交流正在创造日益成熟的人工世界,为共同进化、自发的自组织以及双赢合作的涌现而准备着。在这个时代,开放者赢,中央控制者输,而稳定,则是由持续的误差所保证的一种永久临跌状态。