1.1 源起达特茅斯会议
以计算机、互联网、移动通信技术为代表的第三次工业革命发端于20世纪70年代,期间催生了无数的创新产品和商业奇迹,广泛而深刻地改变了人们的生活乃至思维方式。其带来的生产力飞跃为全球经济注入了强大的活力,然而,随着时间的推移,这场技术变革的红利逐渐耗尽。科技创新乏力,经济增长的底层动力渐渐熄火,随之而来的经济增长停滞、贫富分化加速、社会共识瓦解、地缘政治危机等,都已在进行时。人类社会似乎从未如此期盼新技术革命的到来。就在人类文明即将再次滑入存量内卷深渊的前夕,以ChatGPT为代表的AIGC新技术出现,我们几乎可以很肯定地说,它来了,带着第四次工业革命的礼物跑来了!
新技术革命的浪头已清晰可辨,眼见一场前所未有的变革即将席卷全球,我们不禁要问:它从何而来?又将把我们带向何方?下面,就让我们暂时地将眺望的目光投向过去,一同审视人工智能的发展历程。
回顾人工智能技术的发展历程,我们发现,人工智能经历的三次兴起浪潮均源于底层算法的革命性进展,如图1-1所示。而前两轮的衰落是由于数据处理性能及底层算法的局限,使AI技术从成熟度以及商业可行性上无法落地。2006年,Hinton提出颠覆性的深度学习算法,使得AI产业迈出关键性一步:利用多层神经网络,将人类从复杂的算法归纳中解放出来,只要给予机器足够多的数据,便能使其自动归纳出算法,叠加底层算力GPU的不断发展及互联网时代海量数据的积累,人工智能三驾马车:算法、算力和数据皆已准备就绪,使AI技术彻底走出实验室,逐步渗透进各个行业和场景。
图1-1 人工智能三次兴起浪潮
源起:达特茅斯会议
现在一说起人工智能这一概念的起源,公认是1956年的达特茅斯会议。但在此之前,我们必须要提到一个人——图灵,他详细介绍了一种名为“模仿游戏”(The Imitation Game)的测试方法,也就是我们后来更为熟悉的图灵测试。根据《艾伦·图灵传》中的介绍,图灵设想了一种游戏:房间中有一男一女,房间外的人向房间内的男女提问,里面的两个人只能以写字的方式回答问题,然后请房间外的人猜测哪一位回答者是女人。注意,在这一测试中,男人可以欺骗猜测者,让外面的人以为自己是女人,女人则要努力让猜测者相信自己。而将这一男一女换成人与计算机,如果猜测者无法根据回答判断哪个是人,哪个是计算机,那么可以判断计算机具有人类智能,如图1-2所示。
图1-2 The Imitation Game测试方法
1952年,图灵在一场BBC广播中,提出一个新的更为具体的想法:让计算机来冒充人,如果判断正确的人不足70%,也就是超过30%的人误认为与自己说话的是人而不是计算机,那么可以判断计算机具有人类智能。图灵测试自诞生来产生了巨大影响,图灵奖被称为“计算机界的诺贝尔奖”,图灵也被冠以“人工智能之父”的称号。
时间来到1956年的美国汉诺斯小镇宁静的达特茅斯学院,约翰·麦卡锡、马文·闵斯基、克劳德·香农等学者聚在一起,共同讨论着机器模拟智能的一系列问题,如图1-3所示。麦卡锡给这个活动起了一个名字:人工智能夏季研讨会(Summer Research Project on Artificial Intelligence)。会议足足开了两个月的时间,虽然大家没有达成普遍的共识,但是却为会议讨论的内容起了一个名字:人工智能。因此,1956年也就成为了人工智能元年。
图1-3 达特茅斯会议:AI的先驱者
会议的主要发起人——约翰·麦卡锡(John McCarthy),计算科学家、认知科学家,也是他提出了“人工智能”的概念。麦卡锡对于人工智能的兴趣始于1948年参加的一个名为“脑行为机制”的讨论会,会上,冯·诺伊曼(John von Neumann)提出的自复制自动机(可以复制自身的机器)激起麦卡锡的好奇,自此他开始尝试在计算机上模拟智能。达特茅斯会议前后,麦卡锡的主要研究方向是计算机下棋。
另一位积极的参与者是当时在哈佛大学的明斯基(Marvin Minsky,1969年图灵奖获得者),他的老师塔克(Albert Tucker)多年来担任普林斯顿大学数学系主任,主要研究非线性规划和博弈论。1951年,明斯基建造了世界上第一个神经网络模拟器Snare。在Snare的基础上,明斯基解决了“使机器能基于对过去行为的知识,预测当前行为的结果”这一问题,并完成了他的博士论文“Neural Nets and the Brain Model Problem”。
塞弗里奇(Oliver Selfridge),模式识别的奠基人,后来领导了MAC项目,这个项目后被分为计算机科学实验室与人工智能实验室,又合并为麻省理工学院最大的实验室MIT CSAIL。
另外两位重量级参与者是纽厄尔(Allen Newell)和西蒙(Herbert Simon),这两位学者后来共享了1975年的图灵奖。纽厄尔在普林斯顿大学数学系硕士毕业后,加入了美国著名的兰德公司,并结识了西蒙,开始了他们一生的合作。纽厄尔和西蒙提出了物理符号系统假设,简单地说就是:智能是对符号的操作,最原始的符号对应于物理客体。这一假设与西蒙提出的有限合理性原理成为人工智能三大学派之一——符号主义的主要依据。后来,他们与珀里思(Alan Perlis,第一届图灵奖获得者)共创了卡内基-梅隆大学的计算机系。最后,信息论的创始人香农(Claude Shannon),他比其他几位年长10岁左右,当时已经是贝尔实验室的大佬。1950年,香农发表论文“Programming a Computer for Playing Chess”,为计算机下棋奠定了理论基础。
达特茅斯会议后不久,1956年9月,IRE(后来改名IEEE)在麻省理工学院召开信息论年会,麦卡锡受邀做一个对一个月前达特茅斯会议的总结报告。这引起了纽厄尔尤其是司马贺的不满,他们认为麦卡锡只能聊,没干货,而达特茅斯会议唯一的干货是纽厄尔和司马贺的程序“逻辑理论家”。打了一圈架,最后纽厄尔和司马贺做了妥协:麦卡锡先做总结报告,但最后还是由纽厄尔和司马贺讲他们的“逻辑理论家”并发表一篇题为“Logic Theory Machine”的文章。明斯基认为是他的协调起了作用,但纽厄尔晚年则只对香农的邀请有印象,而司马贺的回忆录则说是大会的主席罗森布拉特和司马贺散了很长一圈步才了断。明斯基机敏异常,讲话时带幽默,但在对这段历史的重构中,却给人印象有点太“刁滑”(cynical),原因也不难猜出。研究历史有时必须得全方位,空间或时间上的接近不见得就真实。太接近时,当事人还都活着,还在一个圈子里混,不方便互相揭短,但在接近生命末期,或者功成名就,或者人之将死,或者对头已死无所顾忌,敞开了说,有时虽有夸张,但一不留神就会流露真话,纽厄尔属于后者。明斯基“刁滑”可能和他身体好有关系,偌大岁数也没不惑,觉得还有好长的路要走。