图灵的大教堂:数字宇宙开启智能时代
上QQ阅读APP看书,第一时间看更新

第一部分 高等研究院,数字宇宙的滥觞

01 历史选择了1953年

倘若创造生命有机体如此容易,你为何不自己试试?

尼尔斯·奥尔·巴里塞利,1953年

1953年3月3日下午10时38分,在新泽西州普林斯顿大学古老小径(Olden Lane)的尽头,一栋一层楼的砖房里,挪威裔意大利数学生物学家尼尔斯·奥尔·巴里塞利(Nils Aall Barricelli),通过绘制魔术扑克生成的随意数字,组成了5千字节的数字宇宙。“为了验证一种进化的可能性,即与人造宇宙中生物体的进化相类似的进化的可能性,人们进行了一系列的数值试验。”他说道。

数字宇宙——不管是其中的5千字节还是整个互联网,都是由两种二进制数字所组成的:它们代表着空间差异和时间差异。数字计算机遵循明确的规则,在两种形式的信息之间进行转换——结构和序列。体现为结构(空间上有差异,但是不随时间改变)的二进制数字我们称为内存,而体现为序列(时间上有差异,但是不随空间改变)的二进制数字我们称为代码。门(gate)是二进制数字从一个时刻过渡到下一个时刻时横跨两个部分的交叉口。

位(bit)这一术语是二进制数字(binary digit)的缩写,例如40位。这一术语是在1945年9月,由统计学家约翰·图基(John W.Tukey)所提出的,当时他才加入冯·诺依曼的项目不久。信息理论学家克劳德·香农(Claude Shannon)在他1945年创作的机密论文《密码学的数学理论》(Mathematical Theory of Cryptography)中,精准定义了传输信息中存在的基本单位——它是两种选择中的唯一区别。他的这一篇论文在1948年扩展成了《传播的数学理论》(Mathematical Theory of Communication)一书。“生异之异”(a difference that makes a difference),就是控制论专家格雷戈里·贝特森(Gregory Bateson)将香农所述的概念转化为非正式术语的方法。对数字计算机来说,唯一会造成变化的就是0和1之间的区别。

这两个符号足以编码由弗朗西斯·培根(Francis Bacon)在1623年所建立的任何通信。“这两个数字在5位上的移项足够表述32种差异,人类能够通过这种方式,在任何地方表述和阐明他的意图……能够同时表现两方面的差异。”他在例证这种二进制编码如何以书写的速度、声速或者光速传播之前,这样写道。

继托马斯·霍布斯(Thomas Hobbes)在1656年发表了《运算或逻辑》(Computation,or Logique)一文之后,戈特弗里德·威廉·莱布尼茨在1679年提出,由0和1构成的二进制编码足以进行逻辑和算法运算。“推理,我觉得就是运算,”霍布斯曾说过,“进行运算,要么就是对许多事物相加求和,要么就是需要知道从一物中取出一物之后还会剩下什么。因此,推理也就是做加法或减法运算;而如果有人认为乘法和除法也要添加进来,那我也不会反对,毕竟……一切推理都是以这两种推理运算来演绎的。”新计算机所具备的能力,不外乎就是一台拥有40960比特内存的超快速加法器所具备的能力。

1953年3月,世界上已拥有53千字节的高速随机存取内存。其中,有5千字节存储在古老小径末端的砖房里,有32千字节分别存储在8台计算机内——它们全部是高等研究院计算机的克隆品,而另外16千字节则不均匀地分布在其他10台计算机内。数据以及一些早期的程序通过穿孔卡片和纸带进行交互。每座岛屿在这片新群岛中都自成一体。

数字化比电子化更有趣

1936年,逻辑学家艾伦·图灵曾通过对一种可以在无限伸展的纸带上读、写、记忆和擦除标记的设备进行精准定义,将数字计算机的能力和局限形式化了。在这种“图灵机”(Turing Machine)之后,图灵又展示了通用图灵机(Universal Computing Machine),也就是说,只要有足够的时间、足够的纸带和精准的定义,它就能模拟其他任何计算机器的运算过程。指令是通过网球(tennis balls)或电子执行的,或者说内存是存储在半导体或者纸带上的,都不会影响到计算结果。图灵指出:“数字化应该比电子化更有趣。”

冯·诺依曼的目标是构建一台以电子速度运行的通用图灵机,其核心就是一个32×32×40位矩阵的高速随机存取内存——这也是迄今为止,所有数字化设备的核心所在。“随机存取”意味着所有单个存储单元共同构成了计算机的内在“灵魂”,并且可以随时同步进行访问。“高速”意味着内存能够以光速而非声速进行存取访问。正是这一限制的消除,才使得通用图灵机的能力得以释放出来。否则,它只是一个不切实际的构想。

1945年,电子元件被广泛采用,但是数字行为却并不适用当时的规则。图像是通过扫描成线(不是分解成位)来进行播送的。雷达模拟显示由连续扫描微波束所返回的回波。第二次世界大战结束后,家家户户的客厅里都配备了高保真音响系统。它的好处在于将模拟录音压入唱片,几乎不会造成任何的数值损失。数字技术——电传(Teletype)、莫尔斯电码(Morse Code)、穿孔卡片会计机械设备,被认为过时、精确度低而且运行缓慢。模拟技术统治了世界。

美国高等研究院团队通过调整模拟阴极射线示波管(CRT),完全实现了电子化的随机存取存储。阴极射线示波管是如香槟酒瓶一般大小和形状的真空玻壳,不过它的壳壁薄如香槟杯。示波管较宽的一端形成了一个带荧光内涂层的圆形屏幕,而窄的一端是一个发射电子流的高压电子枪——通过一个两轴电磁场可以让它的靶心偏转。阴极射线管是模拟计算机的一种形式:通过改变偏转线圈的供电电压来改变电子束追踪的路径。特别是在其作为示波器的时候,可以用于加、减、乘、除信号——结果直接以偏转的幅度和时间频率的函数来显示。从这些模拟技术开始,数字宇宙初现雏形。

运用他们战时在雷达、加密以及防空和火控领域学到的经验,冯·诺依曼的工程师们对偏转电路进行了脉冲编码控制,并将阴极射线管屏幕分成了能被电子束单独定位的、数值上可寻址的32×32阵列。因为所产生的电荷会在涂层的玻璃表面停留几分之一秒,并且能够定期更新,因此每根直径13厘米的阴极射线管可以存储1024比特的信息,并且任何指定位置在任何时间都能够被访问。此时,由模拟技术转向数字技术的历史齿轮已经启动。

美国高等研究院的计算机包含40根阴极射线内存管——它们对内存地址进行分配的方法,就像一家有40层楼的酒店,前台服务员在同一时间分发相似的房间号给40位不同的客人。利用建筑原理,即一对5位坐标(25 = 32)标识了1024个存储单元中含有40位的字符串(或“字”)的内存地址,数字宇宙中的代码实现了暴增。在24微秒内,任何特定的40位代码串都可以被检索到。这些40位代码串可能不仅包含数据(即用于“表意”的数字),还包含可执行的指令(即用于“运算”的数字)——这包括调整现行指令的指令,或转移以控制另一个地址以及自此遵从新指令的指令。

由于10位指令码与10位指定的内存地址相结合,所得出的是一个40位的字符串,所以结果会是一个连锁反应,即类似于原子弹内的“两换一”中子裂变。结果就是,一切都乱套了。随机存取存储让机器世界得以一探数字的能力,同时,数字世界也得以一探机器的能力。

MANIAC的诞生

计算机大楼的核心构建一般是由美国陆军军械部(Army’s Ordnance Depart- ment)和美国原子能委员会(Atomic Energy Commission)共同承担的。而关于一个特定的临时建筑,为了调和政府合同的条款与周边社区的意见,高等研究院又承担了9000美元(相当于现在的10万美元)的费用来铺饰面砖以完成这一大楼的搭建。

普林斯顿高等研究院和美国原子能委员会之间有着密切的联系。罗伯特·奥本海默是普林斯顿高等研究院的院长,同时也是美国原子能委员会总顾问委员会的主席。刘易斯·斯特劳斯(Lewis Strauss)是美国原子能委员会的主席,同时也是普林斯顿高等研究院董事会的主席。第二次世界大战期间,在洛斯阿拉莫斯蓬勃兴起的科学和军火生产在美国原子能委员会的赞助和支持下,转移到了普林斯顿。“陆军合同规定,由陆军弹道研究实验室(Ballistic Research Laboratory of the Army)进行全面监督,”这在1949年11月1日被提出,“然而,美国原子能委员会规定由冯·诺依曼进行监督。”只要进行武器计算的时候有计算机可用,其余时间冯·诺依曼可以自由支配这些计算机。

1947年,刘易斯·斯特劳斯推荐奥本海默成为研究院院长。不过,1954年,他与奥本海默反目。而在1953年的时候,两人还保持着良好的关系。1953年4月10日,斯特劳斯对奥本海默说:“我为你准备了一箱力士金庄园Lascombes,红酒品牌。——译者注作为礼物,地址是位于麦迪逊大道679号(靠近61号街)的雪莉酒业有限公司(Sherry Wine & Spirits Co.),我希望你和姬蒂会喜欢。”

4月22日,奥本海默回复:“我们是前两天拿到酒的,而且当天晚上就开了一瓶。味道好极了!我和姬蒂不仅要谢谢你的好意,还要谢谢你给我们带来了如此多的快乐。”奥本海默和姬蒂喝醉了。一年后,斯特劳斯付出了非常多的努力来将原子能技术转移到美国政府手中,而之后他又与自己的雇主反目来反对氢弹的研制。进而,在原子能委员会人事保障局举办了一次戏剧性的听证会之后,斯特劳斯被剥夺了安全许可证。

不过,计算机的发展仍在继续。此时,由尼古拉斯·梅特罗波利斯和斯坦利·弗兰克尔(Stanley Frankel)带领的一个来自洛斯阿拉莫斯的小团队悄然出现在了普林斯顿高等研究院。通常,研究院有两种类型的成员:一种是永久成员,即由全体成员共同决定聘用终身的成员;另一种是访问成员,即受独立学院邀请进行访问的成员,通常访问时间是一年或不到一年。梅特罗波利斯和弗兰克尔不属于其中任何一种,但是他们就是出现了,神秘地悄然而至。“我唯一知道的消息就是,梅特罗波利斯的到来是为了计算氢弹的可行性。”工程师杰克·罗森伯格(Jack Rosenberg)回忆道。1949年,杰克·罗森伯格在爱因斯坦70寿辰的时候,为他的房子设计、建造并安装了高保真音频系统,这个音频系统是使用计算机项目多出来的一些真空管和其他部件制成的。“我知道的就只有这些。我当时觉得那些部件有点脏,但是爱因斯坦说:‘这正是它们的用途所在。’他超越了他所在的时代。”

这台新机器被命名为数学分析数值积分计算机(Mathematical and Numerical Integrator and Computer,简称MANIAC),并且在1951年夏天进行了第一次测试——连续60天不间断的热核计算。计算结果是通过在南太平洋实施的两次大型核爆炸来证实的:第一次是1952年11月1日,“常春藤麦克”(Ivy Mike)在埃尼威托克环礁(Enewetak)被引爆,产生了1040万吨的梯恩梯当量(TNT);第二次是1954年2月28日,“喝彩城堡”(Castle Bravo)在比基尼环礁被引爆,产生了1500万吨的梯恩梯当量。

1953年属于热核武器、存储程序计算机和DNA

1953年是介于两者之间疯狂进行准备的一年。这一年,在内华达测试基地(Nevada Test Site)进行的11次核试验,共产生了25.2万吨的梯恩梯当量。当时,大部分人关心的不是如何去实现大型的、壮观的爆炸,而是想了解更为温和的核爆炸如何能改变以触发热核反应并实现可交付成果的氢弹。

“常春藤麦克”由82吨液态氘所推动,在一个车厢大小的油舱里冷却到-250°C,展示了氢弹引爆的原理;而“喝彩城堡”由固体氘化锂所推动,代表一个可部署的武器,由B-52轰炸机按小时交付。正如冯·诺依曼在1953年初向空军方面指出的,火箭越来越大,而氢弹却越来越小了。那么,在几分钟之内完成发射则是接下来要做的事情。

美国拥有了更小的炸弹,但是俄罗斯却配备了更大的火箭。就在1953年,美国首次投入了超过100万美元来研发导向导弹(guided missile)。这里的“导向”,并不代表我们今天所理解的导弹的精确度。“一旦发射出去,我们只能知道它打到了哪个城市。”1955年,冯·诺依曼回复当时的副总统时这样说道。

数值模拟是武器设计中必不可少的环节,正如奥本海默所说的那样,是“反对任何形式的实验方法少见的证据”。1953年,也就是尼尔斯·巴里塞利来到普林斯顿的时候,一个大的热核计算刚刚完成,而另一个则正在进行中。计算机通常在晚上要移交给由福斯特(Foster)和塞尔达·埃文斯(Cerda Evans)领导的洛斯阿拉莫斯小组。3月20日,会议决定“在埃文斯的问题运行期间,计算机要能够在星期六和星期日的白天运行一段时间,而不是从午夜一直运行到早上8:00”。巴里塞利必须抓紧一切半夜和大清早的间隙,即计算机没有在进行导弹计算的时间进行数值计算,以实现他的数值世界。

1953年3月3日的晚上,当巴里塞利的数值有机组织第一次漫步于计算荒原的时候,约瑟夫·斯大林(Joseph Stalin)在莫斯科因中风陷入了昏迷。两天之后,斯大林去世,而此时离苏联在塞米巴拉金斯克(Semipalatinsk)引爆第一颗氢弹只有5个月的时间了,斯大林错过了这一历史性的时刻。斯大林辞世后,谁会上任或者接下来会发生什么,没有人知道。但很明显,苏联内务人民委员会(NKVD)秘密警察和苏联核武器计划的主管拉夫连季·贝里亚(Lavrentiy Beria)会是斯大林的继承人。美国原子能委员会把这视为最大的威胁。一整夜,巴里塞利的“共生问题”(Symbiosis Problem)都运行得很顺畅。第二天早上,计算机日志显示“爆炸迫近”。当天晚些时候,日志上“迫近”两个字之后是一张蘑菇云的素描图。

1953年,三项重大技术革新横空出世:热核武器、存储程序计算机和对生命密码DNA的阐释。同年4月2日,詹姆斯·沃森(James Watson)和弗朗西斯·克里克(Francis Crick)在《自然》杂志上发表了《脱氧核糖核酸的结构》(A Structure for Deoxyribose Nucleic Acid)一文,指出双螺旋结构“显示了遗传物质的一种可能的复制机制”。他们暗示了碱基对编码结构,即我们识别的A、T、G、C核苷酸序列,正是通过这种结构,活细胞得以读、写、存储和复制遗传信息。“如果碱基对的一端是一个腺嘌呤,无论它处于哪条链上,基于这些假设可以认定,另一端就是一个胸腺嘧啶;鸟嘌呤和胞嘧啶也遵循相似的原理,”他们这样解释道,“如果形成了特定的碱基对,则遵循的原则是:如果给定一条链上的碱基序列,那么另一条链上的碱基序列也自动得到确定。”

序列和生物结构之间的转换机制,与序列和技术结构之间的转换机制碰撞到了一起。生存在嘈杂的模拟环境中的生物有机体,学会了一旦产生即不断重复,借助数字相位校正技术传达;同样的技术也被运用到了中继站海底电缆传输可识别信号方面,因为噪声正是在海底被引入的。从1953年开始,这项技术一直运用至今。

计算机如何开启思维与实现复制

自上而下解码生命活动过程的竞赛已经拉开序幕。而有了自修改指令下萌生出的空荡的数字世界,我们迈出的第一步却是从下至上编码生命活动的过程。“虽然这个世界上存在的特殊条件似乎更加青睐有机化合物组成的生命形式,但这不足以证明创建其他截然不同的生命形式是绝无可能的。”巴里塞利解释道。新型计算机面临着两个问题:如何颠覆我们对生命形式的认识,以及如何创建未知的生命形式

尽管计算机最初仅仅是一个5千字节的矩阵,现在却已经发展到了每秒超过两万亿个晶体管(处理速度和内存容量增长的衡量手段)和5万亿比特的存储容量(代码增长的衡量手段)。然而,人类在1953年面临的那两个问题依然悬而未决。图灵的问题是:计算机怎样才能开启思维?而冯·诺依曼的问题是:计算机怎样才能实现复制?

当年,美国高等研究院力排众议,同意让冯·诺依曼及其团队研制计算机,他们所担忧的是,数学家们的避难所会由于工程师的出现而受到侵扰。然而,绝对没有人想到事情的发展恰恰相反,数学家们在符号逻辑上的专长竟将编码序列的潜力激发到如此地步。“那些日子,我们都只是忙于手头的工作,对于这次可能发生的剧烈爆炸想得不多。”威利斯·韦尔说。

氢弹爆炸是意外还是有意为之呢?“军方需要计算机,”哈利斯·迈耶(Harris Mayer)解释说(他是洛斯阿拉莫斯国家实验室的物理学家,同时也为约翰·冯·诺依曼和爱德华·泰勒工作),“军方有需求和资金,却没有卓越的人才,而约翰·冯·诺依曼就是这样的人才。我想,当约翰知道我们需要计算机为氢弹实验进行计算时,他心里就已经有数了。”