人工智能导论(第2版)
上QQ阅读APP看书,第一时间看更新

1.2.4 第四阶段:大突破时期(1993年至今)

对人工智能发展而言,大突破时期也是一个超越历史上任何一个阶段的、非凡的创造性时期。1993年,作家兼计算机科学家弗诺·文奇(Vernor S. Vinge)在他发表的一篇文章中首次提到人工智能的“奇点理论”。他认为未来某一天人工智能会超越人类,并且会终结人类社会,进而主宰人类世界。这个时间点被他称为“即将到来的技术奇点”。

这一时期,模拟自然界鸟类飞行的粒子群算法和模拟蚂蚁群体行为的蚁群算法,以及用于求解函数优化等问题的各类算法相继出现,推动了从进化计算发展而来的计算智能、自然计算等人工智能分支的发展。

1995年,贝尔实验室(Bell labs)科学家科琳娜·科尔特斯(Corinna Cortes)和统计学家、数学家弗拉基米尔·万普尼克(Vladimir N. Vapnik)提出了软边距的非线性支持向量机(support vector machine,SVM),并将其应用于手写数字识别问题。这一研究成果在发表后得到了科学家广泛的关注和引用,其影响在当时远超人工神经网络。以SVM为代表的集成学习、稀疏学习、统计学习等多种机器学习方法开始占据主流舞台。在之后的10年里,深层次的人工神经网络并未受到关注。

1996年,人工神经网络领域的重要人物杨立昆(Yann LeCun)成为贝尔实验室的图像处理研究部门主管,他开发了许多新的机器学习方法,包括模仿动物视觉皮层的卷积神经网络(convolutional neural network,CNN)。

1997年5月11日,国际象棋世界冠军加里·卡斯帕罗夫(Garry Kasparov)与IBM公司的国际象棋计算机“深蓝”的6局对抗赛降下帷幕。在前5局以2.5∶2.5打平的情况下,卡斯帕罗夫在第6局决胜局中仅走了19步就甘拜下风,整场比赛进行了不到1h。“深蓝”综合了多种人工智能知识表示、符号处理、搜索算法和机器学习技术,成为第一台在多局赛中战胜国际象棋世界冠军的计算机,这是人工智能发展的重要里程碑。图1.6所示为卡斯帕罗夫与国际象棋计算机“深蓝”对弈现场。

2006年,加拿大多伦多大学教授杰弗里·辛顿联合他的学生(后来成了纽约大学教授的)杨立昆和加拿大蒙特利尔大学教授约书亚·本吉奥(Yoshua Bengio),发表了具有突破性的论文《深度置信网络的快速学习方法》(“A Fast Learning Algorithm for Deep Belief Nets”),开创了深度神经网络和深度学习的技术历史,并引发了一场现代商业革命。

2010年,斯坦福大学教授、华人学者李飞飞创建了一个名为ImageNet的大型数据集,其中包含数百万个带标签的图像,为深度学习技术性能测试和不断提升提供了舞台。自2010年以来, ImageNet每年都会举办一次软件竞赛,即ImageNet大规模视觉识别挑战赛(简称ImageNet挑战赛),如图1.7所示。参赛程序对物体和场景进行分类和检测,正确率最高者获胜。通过这个比赛,许多优秀的深度学习算法脱颖而出。

图1.6 卡斯帕罗夫与国际象棋计算机“深蓝”对弈现场(右为“深蓝”现场操作者)

图1.7 ImageNet挑战赛

2012年,ImageNet挑战赛引发了人工智能“大爆炸”,辛顿和他的学生亚历克斯·克里热夫斯基(Alex Krizhevsky)利用一个8层的卷积神经网络——AlexNet,以超越第2名(使用传统计算机视觉方法)10.8%的成绩获得了冠军。AlexNet不仅可以让计算机识别出猴子,还可以使计算机区分出蜘蛛猴和吼猴,以及各种各样不同品种的猫。

2015年,微软亚洲研究院何恺明等人使用152层的残差网络(residual network,ResNet)参加了ImageNet挑战赛,并取得了整体错误率3.57%的成绩,这已经超过了人类平均错误率5%的水平。由于许多算法已经达到了竞赛预期的最高水平,因此该比赛于2017年终止。

2011年,计算机科学家杰夫·迪安(Jeff Dean)和吴恩达发起“谷歌大脑”项目,用16000台计算机CPU搭建了一个具有10亿个连接的深度神经网络,并把这个庞大的网络想象成一个婴儿的大脑,然后让“大脑”看一些无标注的在线视频。在此之前,没有人告诉过这个“大脑”什么是猫,但是“谷歌大脑”在观看了大量视频之后自行学会了认识猫脸。

2016年,DeepMind公司开发的围棋智能系统AlphaGo战胜了人类棋手冠军李世石。该系统集成了搜索、人工神经网络、强化学习等多种人工智能技术。这一事件也是人工智能发展史上的一个重要里程碑。图1.8所示为AlphaGo与人类棋手对弈的阶段棋局。

(a)Games1-10 (b)Games41-50

图1.8 AlphaGo与人类棋手对弈的阶段棋局

2016年之后,以AlphaGo为代表的新一代人工智能引起了各国政府的关注。各国政府纷纷进行顶层设计,在规划、研发、产业化等诸多方面提前布局,掀起了人工智能研发的一场国际新竞赛。深度学习技术在图像识别、语音识别、机器翻译等方面取得了很好的应用效果,对工业界产生了巨大影响。世界著名互联网巨头公司及众多的初创科技公司,纷纷加入人工智能产品的“战场”,从而掀起了人工智能发展历史上的第三次高潮。

2019年1月25日,DeepMind公司开发的AlphaStar在《星际争霸2》游戏中以10∶1的战绩战胜了人类冠军团队。2020年11月,DeepMind研发的人工智能系统AlphaFold解决了困扰生物学界50年的“蛋白质折叠”难题。科学界认为DeepMind在解决蛋白结构问题上“迈出一大步”。现在,AlphaFold 系统已被业内专家认可。深度学习技术已经在材料学、化学、生物学,甚至物理学、数学等领域帮助科学家们接连取得一些重大科学问题,成了人类科学研究和发现的“好帮手”。

近5年来,超级计算、大数据与深度学习技术的结合也是引发人工智能第三次高潮的重要原因。相比于历史上任何一个时期,现阶段是联结主义人工智能对符号主义人工智能的胜利,以人脑神经网络为原型的联结主义成了实现大规模智能系统的有效途径,但从长远来看,这并不代表符号主义的研究没有价值。

基于人工神经网络发展而来的深度学习虽然取得了巨大的成功,但纵观人工智能发展历史,它并不是新方法。其成功主要得益于一种图形处理单元(graphics processing unit,GPU)的并行计算技术,以及超大型计算机的计算能力。

实际上,在联结主义迅猛发展的同时,传统的符号处理、知识表示、搜索技术及机器学习等强化学习技术也在不断发展。

2018年6月,智能软件“项目辩论者”参加了在旧金山举行的对战人类选手的公开辩论赛。在没有提前获知辩题的情况下,项目辩论者依靠强大的语料库,独自完成陈述观点、反驳辩词、总结陈述的整个辩论过程。2019年2月11日,项目辩论者和人类冠军辩手在旧金山进行了第二次人机辩论赛。这套智能辩论系统具有强大的语义理解和语言生成能力。它的潜在价值在于,可以通过不断提升数据处理能力,为医生、投资人、律师和执法机关,以及政府工作人员(在做出重要决策时)提供客观、理性的建议。

知识图谱是一种实现机器认知智能的知识库,是符号主义持续发展的产物。它从最初就在知识表示、知识描述、知识计算与知识推理等方面不断发展。自2015年以来,知识图谱在诸如问答、金融、教育、银行、旅游、司法等领域中进行了大规模的应用。从最初的简单地对人类知识进行表示,到现在的大规模应用,知识图谱已经先后经历了将近50年的时间,并已经成为以发展认知智能为目标的重要基础技术。

在联结主义和符号主义人工智能各自不断发展的同时,人工智能领域出现了脑机接口、外骨骼、可穿戴等人机混合智能技术。随着核磁共振等物理观测和仪器技术的进步,脑科学和神经科学也在不断发展,人们对大脑和神经系统在物理微观层面的认识也越来越深入,以大脑生物和物理为基础的类脑计算技术得以发展,类脑芯片、智能芯片等新型硬件产品和技术不断涌现。