算法的力量:人类如何共同生存?
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第一章 日益强大的系统

没有什么比探索未知更让人害怕的。

——埃利亚斯·卡内蒂,《群众与权力》(1984)

让我们从一个对自身所处位置的调查说起,并勾勒出一个即将到来的世界。

下个世纪,政治将被三大发展所转变:日益强大的系统、日益综合的技术和日益量化的社会。这些变化将共同带来一个崭新的、不同的集体生活——数字生活世界。“生活世界”这个略显古怪的词,来源于德语Lebenswelt,它指的是所有构成我们个人或集体世界的即时的体验、活动和联系。当你想象数字生活世界时,不妨把它想象成一个紧实而丰富的系统,它将人类、强大的机器和充足的数据连接在一张相当复杂精密的网中。在本章,我不想去评估或是批评我所描述的那些技术的效果。我的目的是要识别并理解它们,然后(在第四章),我要去检视那些将帮助我们更清楚地思考政治的全部意义为何的智能工具。

接下来的三章内容包括许多现实生活中的例子,但我的本意不是让大家马上把它们一股脑都记在心里。相反,我们的宗旨只是去一瞥那偷偷跟踪着我们的未来,哪怕只是看个大概。承认我们很快就会与拥有超凡能力的计算机相伴而生,将是论证的起点。这些超级计算机属于“日益强大的系统”范畴,[1]而它们将成为数字生活世界第一个决定性的特征。

人工智能

人工智能(AI)领域兴起于1943年,关注的是建设一种“智能的”数字系统。当我在此提到人工智能时,我是在描述一种可以执行任务的系统,而这些任务此前被认为需要人类的认知和创造过程参与才能实现。[2]它的进步并不是一帆风顺的,但它在当下的确大放异彩且迅速聚集。成千上万种以前只有人类才能进行的活动,如今被数字系统更快、效率更高、更准确地完成,人类的完成度根本不能与其相提并论。

人工智能系统已经快要超越人类在翻译自然语言、识别人脸、模仿人类说话方面的能力了。[3]使用人工智能的自动驾驶汽车被广泛期待在接下来的几年中普及(福特公司正在计划于2021年推出一种面向大众市场的自动驾驶汽车)。[4]在2016年,微软发明了一种人工智能语言识别系统,能够转录人类的对话,这个系统的错误数等于甚至少于专业的人类速记员。[5]牛津大学的研究者们发明了一种准确率高达93%的人工智能“读唇语”系统,相比之下,专业唇语翻译人员的正确率只有60%。[6]人工智能系统已经可以撰写体育、商业和财经方面的文章了。[7]在2014年,美联社开始使用算法计算上千份此前由人工撰写的收益报告,又生产了15倍于原数额的报告。[8]人工智能系统已经导演了电影,制作了电影预告片。[9]人工智能“聊天机器人”(能跟人聊天的系统)将很快用于餐馆点餐。[10]很不幸,工程师们甚至还造出了可以撰写支持某个政党的全部演讲的人工智能系统。[11]以前我们总觉得,政客们讲起话来就像没有灵魂的机器人,听他们发言的滋味真不好受,结果现在我们拥有讲起话来像政客一样的机器人了。

每天,算法都会代表投资者在金融市场上进行无数次交易。投资者们相信,算法能够基于变化的市场状况制定复杂的战略。深度知识(Deep Knowledge Ventures)是一家总部位于香港的风险投资公司,该公司为其董事会指定了一套名叫VITAL(先进生命科学确认投资工具)的算法。[12]在医疗领域,人工智能系统在区分不同种类的肺癌并预测存活期上做得要比人类病理学家还好。研究者们相信,它们在区分与预测其他种类癌症的相应过程中的表现,也会优于人类病理学家。[13]在法律方面,一个人工智能系统正确判断了欧洲人权法院审理的上千个案例中79%的结果。[14]致命自主武器系统,也就是人工智能支持的导弹、军用无人机和武器化机器人,也正在开发中。如果运用到战场上,它们将有能力基于特定的标准锁定并摧毁目标,随后返回或是自我摧毁——它们随时准备在适当的时候行动,不需要人类决策对其干预。[15]

技巧和战略类运动可以有效地衡量数字系统能力的增强程度。简言之,这些数字系统如今几乎在每一个运动项目上都击败了最优秀的人类玩家,包括西洋双陆棋(1979)、跳棋(1994)和国际象棋。在国际象棋领域,IBM研发的深蓝在1997年战胜世界冠军加里·卡斯帕罗夫(Garry Kasparov)的比赛中一战成名。在2016年,Google DeepMind的人工智能系统AlphaGo震惊了世人,在古老的围棋项目上以4:1击败了韩国围棋大师李世石,在此一役中,AlphaGo使用了令人眼花缭乱的创新战术,要知道,与国际象棋比,围棋的复杂程度要以指数倍计。李世石甚至有点心酸地指出:“我还是能赢一场的,我不会拿这场胜利去交换世界上的任何东西。”[16]

一年后,另一个版本的AlphaGo——AlphaGo Master以3:0的净胜分击败了“地表最强”的人类围棋选手柯洁。[17]

如今,一种更加强大的版本出现了,那就是AlphaGo Zero,它连续100次击败了AlphaGo Master。[18]

早在2011年,IBM的Watson就击败了电视真人秀《危机!》(Jeopardy!)栏目史上两位“最伟大的人类选手”。在这个节目中,主持人提供与以下内容有关的常识“答案”,考察范围涉及运动、科学、通俗文化、历史、艺术、文学和其他领域的通识知识;参赛者则被要求说出这些“答案”对应的“问题”是什么。《危机!》节目要求参赛者有渊博的知识和处理自然语言的能力(包括文字游戏),必须抢在其他选手之前还原相关信息,并用一种可理解的表达方式回答出来。[19]人类冠军们远远不是Watson的对手,Watson的成功在人工智能发展史上树立了一座里程碑。它几乎可以回答任何领域的问题,“比最优秀的人类更快、更准确地回答太阳之下任何领域的问题”。[20]被用在《危机!》节目中的Watson版本,传说其体积像一间卧室那么大。到21世纪20年代早期,这种技术被寄予厚望能取得重大突破,它将被轻松置于一个智能手机大小的计算机中。[21]如今,这个被IBM命名为Watson的机器不再存在于某个物理空间,而是分布存储在云服务器上,商业用户可以在他们的个人电脑和智能手机上轻松登陆Watson。[22]IBM强调,不同版本的Watson能做的远比赢得真人秀比赛要多得多。在2016年年底,一个Watson平台发现了5种与肌萎缩性脊髓侧索硬化症(ALS)有关的基因,这是一种能导致瘫痪和死亡的退化性疾病。这个系统吸收了所有已发表的有关ALS的文献成果,并剖析了人类基因组中的每一个基因。对Watson来说,完成以上工作不过是几个月的事;如果由人类来操作,可能要花上好几年。[23]在2017年年初,日本寿险巨头富国生命保险(Fukoku Mutual Life Insurance)裁员34%,转而采用Watson的“探索者”平台取代他们的工作,消化了好几万份医疗记录、证书和住院数据,以及用来计算投保人支出的手术信息。

人工智能已经产生了大量的次级领域,在每个领域都应用了不同方法来解决各种各样的问题。例如,那些寻求再生人脑的神经工程的人跟寻求“含有拍打式机翼的早期飞行器设计”的人一样,与那些完全运用为人工计算而量身定制的新技术的人之间,在方法谱系上是存在差别的。[24]一些研究者立志寻求跟人类大脑一样的“通用人工智能”,这种通用人工智能天生具有意识、创造力和常识,以及在不同环境中都具备的“抽象思考力”。实现这个目标的途径之一也许是全脑仿真(whole-brain emulation),瑞士的蓝脑工程(Blue Brain project)就正在探索这种方法。这个工程尝试映射、模拟并复制人脑中的800多亿个神经元和十几万亿个神经突触,以及其中枢神经系统的工作情况。[25]全脑仿真依然被看作一个遥不可及的愿景,但它在技术上并非不可能。[26]正如默里·沙纳汉(Murray Shanahan)所说,“将数以百亿计的超低功耗、纳米级的元件组合成一个有人脑智能水平的设备”,人类大脑的存在就是这种技术可能性的证据。[27]

然而,大多数当代人工智能研究并不关心通用人工智能或全脑仿真。相反,它旨在创建具有以下功能的计算机:执行某种特殊任务,这种任务往往是十分狭窄的,而其效用级别却很卓越。AlphaGo、深蓝和Watson并不具备像人脑一样的“思维”。拿深蓝来说,它只有下国际象棋的功能,使用“强大的数字运算能力”去处理每秒钟数以亿计的位置,去推测每个可能的下法,最多能算到二十步左右。[28]

执着于只有狭窄认知能力的机器和能“思考”或“解决”更普遍问题的机器的区别,是很诱人的。相比前者来说,后者是一种更加生动的目标。但人工智能到底是“狭窄”还是“广阔”、是“强大”还是“虚弱”的区别,足以模糊事实——即使是关注范围相当狭窄的人工智能系统,依然能仅凭自己就创造出巨量的新机会和需要谨慎注意的风险。很快,计算机将能够去做人类能做的事情,即使它们完成这些事情的方式与人类不同;除此之外,它们能做的事还有很多。一个人工智能系统也许只能执行少量任务,但这也没关系。至少,数字生活世界似乎将组织起大量相互重叠的人工智能系统,每个系统都被设计来执行特定功能。而对作为接收方的我们来说,也许不太可能去区分它到底是拥有通用智能的系统,还是使用50种不同的次级系统去给人以通用智能印象的系统。在最重要的方面,它们会产生同样的效果。

机器学习

当前人工智能最重要的子领域就是机器学习。佩德罗·多明戈斯(Pedro Domingos)在他的《终极算法》(The Master Algorithm,2015)一书中解释道,让计算机执行某项任务的传统方式是“写下算法”,即一系列向计算机发送的指令,以此“细致入微的细节去解释”计算机应如何执行这项任务。[29]相比普通算法,机器学习的算法能够自行找到识别模型、创建模型并执行任务的方法。它通过调动大量数据,识别模型并进行推断来完成任务。机器学习算法可以同时学习两种知识(“如果某物看起来像X即它是Y”)和技巧(“如果道路向左弯曲,则将车轮向左旋转”)。[30]这个想法是,在某个特定时刻后,“我们不再需要为计算机编程”,而是靠“它们自己给自己编程”。[31]

我描述的许多人工智能系统都采用了机器学习技术。确切地说,机器学习算法无处不在:

在亚马逊,算法决定了当今世界上的人们正在阅读何种书籍,算法在这方面起的作用远超任何一个自然人。美国国家安全局(NSA)的算法决定了谁是潜在的恐怖分子。气候模型决定了大气中二氧化碳的安全水平。选股模型比我们大多数人更能推动经济发展。[32]

当你第一次乘坐自动驾驶汽车时,请记住:

没有工程师编写算法一步步地指导它(自动驾驶汽车),手把手地教它怎么从A地行驶到B地。也没有人知晓如何对汽车编程,让它开动,也没有人需要做这些事。因为一辆配备了学习算法的汽车通过观察驾驶员的行为就能自行学会。[33]

机器学习,借用多明戈斯的话来说,就是自动化本身的“自动化”。[34]这是一项意义深远的进步,因为它让人工智能系统从它们的人类创造者的限制中摆脱了出来。Facebook的工程师们,还有其他工程师,都在开发一种机器学习的算法,一种可以构建其他机器学习算法的算法。[35]

总体来说,机器学习算法有三种“学习”方法。在监督学习(supervised learning)中,人类程序员设置了一系列确定的结果并为机器提供反馈,告诉它们其判断是否与确定的结果相合。相形之下,在无监督学习(unsupervised learning)中,机器将获得数据,然后自行寻找其范式。因此,一个无监督学习的机器可以用来“发现知识”,即建立人类程序员完全没有意识到的连接。[36]在强化学习(reinforcement learning)中,机器被给予“奖励”和“惩罚”,从而告诉它做得是否正确。机器实现了自我完善。

本章描述的很多先进技术,尤其是那些涉及图像、语言和文本的,正是那种所谓受到动物大脑结构启发的、利用“神经网络”进行的“深度学习”技术。谷歌在2012年开启了一项这样的技术,它融合了1000台大型计算机,创建了为数超过10亿的连接。1000万张随机产生于YouTube视频中的图片被提供给这台计算机。没有人告诉它去寻找什么样的图片,这些图片也没有被打过标签。三天后,一个单元学会了如何识别人脸,另一个单元学会了识别一只猫的面部图像(这毕竟是YouTube)。[37]谷歌的工程师们如今利用“决斗”(duelling)神经网络去彼此训练:一个人工智能系统创造现实图像,另一个人工智能系统扮演批判者的角色,试图辨识出它们的真伪。[38]

从运用于游戏的人工智能系统中可以看出对深度学习利用度的快速提升。在1997年打败加里·卡斯帕罗夫的深蓝版本已经植入了许多妙招的基本原则。AlphaGo Zero是最新、最强大的GO-playing人工智能系统的化身,然而,对它来说,最有吸引力的,并不是从与最杰出的人类对弈中“学习”,甚至也不是“学习”人类的比赛,而是从反反复复的自我对抗中“学习”:它从完全随机的步法开始下起,然后随着时间的推移快速成长。[39]

机器学习已经出现一段时间了。通过新算法的发展,更主要的是处理能力和可用数据的爆发性增长,机器学习在近几十年里迅速成长和成功(第三章)。数据对机器学习来说是至关重要的,如果数据太少,机器学习算法的发展便会受阻,如果数据足够多,“一种只有几百行的学习程序就能轻松产生千万行的程序,而且它能在不同问题上反复使用”。[40]这就是数据被称为“新煤矿”[41],而收集数据的人被称为“数据挖掘者”的原因。

然而,我们在本书的不同地方都能见到,对有缺陷的现实世界数据的依赖也能对机器学习系统造成破坏。微软于2016年3月23日在Twitter上推出了其人工智能聊天机器人Tay。Tay可以模拟一个19岁的女孩说话,并能从与其他Twitter用户的交流中学习。在它面世16小时后,Tay被禁止继续运行,因其发布了一系列含有种族主义和色情内容的煽动性推文,其中还有一张希特勒的照片,照片上打着“前方高能”的说明,还有一条推文说:“去他妈的机器人爸爸!我就是这样一个淘气的机器人!”Tay从Twitter上其他用户的这种交流方式中“学习”了此类说法。这个例子表明,人类在社交媒体上如何表达,机器学习也能有样学样。

关于机器学习的最后一点是,在过去,为任何系统提供动力的计算能力(算力)实际存在于该系统中。强大的数字设备,实际上包含了使它们运行的处理器。在上个十年到来的云计算意味着算力不一定要被局限于设备本身:像苹果公司的Siri可在网上被接通。这一点对技术的融合意义非凡,它意味着使用小设备就能调动起大型计算资源(第二章)。这一点对机器学习来说同样重要,因为它意味着机器不需要从它们单独的经历中“学习”,它们也能从其他机器那里学习,以至在这个集群或机群中的每台机器都能为整体的“集体智慧”贡献力量。

算力的几何级数增长

人工智能和机器学习领域的进步源于数学、哲学和神经科学领域的进步。不过,我们此前已经提到,它的进步总体基于两项大的发展:可用数据量的大爆发和算力的爆发式增长。

最近五十年左右,算力——计算机芯片处理数据的能力——呈指数型增长,差不多每两年就要翻一番。一般而言,这个进展预计会持续下去。以当前趋势来看,到2029年,计算机的算力将比2017年要快64倍。如果技术以同样的速度继续进步,那么到2041年,它的算力将比2017年快4096倍。三十年后,计算机将成长到比现在强大千万倍。雷·库兹韦尔(Ray Kurzweil)等人预测,在下一个十年左右,一种普通的台式机(大概1000美元)将匹敌甚至超越人脑的处理能力。到2050年,“1000美元的计算机的算力将超越地球上所有人类脑力的总和”。[42]如果你觉得这听上去是不可能的,那就回望一下我们人类的来处吧。仅仅是在三十年前,5000台台式机才能跟今天的iPad Air的算力相匹敌。[43]若在六十年前想造一个2010年面世的iPad2(如今已经无可救药地过时了),得花100万亿美元,大概是2015年美国联邦预算的25倍。[44]如今,普通的智能手机都比当年送尼尔·阿姆斯特朗(Neil Armstrong)上月球的阿波罗导航计算机(Apollo Guidance Computer)的算力更强。[45]

我们的大脑天生不善于以指数形式思考。我们倾向于以一种直线上升的方式思考正在发生的变化,做不到在事物本身加速时注意到其潜在的变化速率。要正确地看待它,让我们试试(在佩德罗·多明戈斯所举的例子中)想象一个单一的、极小比例的大肠杆菌。这个细菌会一分为二,每15—20分钟就在体积上翻一倍。假设条件适宜,在几小时后,它就会繁殖成一个细菌的领地,但仍然不足以被人类肉眼所见。然而,在24小时后,这个大肠杆菌就会长成与地球差不多大的巨型菌落。[46]这就是几何级数增长的威力。

计算机的算力约每两年提高一倍的理论,通常被称为摩尔定律。这个“定律”实际上不能完全算是一个定律,而更像是一种可观察的发展模式,它被称作“硅谷的指导原则,就如同将十诫合为一诫”。[47]这个原理最初来自英特尔公司的联合创始人戈登·摩尔(Gordon Moore)在1965年发表的文章,他在这篇文章中预测,能被塞到一个集成电路上的组件数可能会每两年大致翻一番。当时,摩尔预测,这种趋势将“至少持续十年”。[48]其他人对他的预测持怀疑态度,觉得再能应验个几年就不错了。结果摩尔定律现已持续了五十多年。沃尔特·艾萨克森(Walter Isaacson)指出,这不仅仅是预言:它是“该行业的目标,在一定程度上帮助这个行业实现了自我”。[49]有趣的是,算力并不是唯一以几何级数速度升级的技术。大量其他技术升级,包括硬盘容量、带宽、磁数据存储、像素密度、微芯片密度、随机存取存储器、光子传输、DNA测序和脑扫描分辨率都在不断发展。[50]如果摩尔定律继续成立,那么在接下来的几十年里,我们都将得以目睹具有超级能力的机器。那是一个每台台式机大小的机器都有全人类的算力的世界,跟我们当下所处的世界完全不同。

有人会说摩尔定律会在接下来的几年中慢慢失去解释力,主要是因为它将在物理上变得不可能——很难将更多的晶体管塞入同一芯片中,当然,过去半个世纪的经济红利慢慢消耗殆尽也是其丧失解释力的原因之一。的确已经出现了一些速度放缓的迹象,即便摩尔定律在过去已经无数次“被谢幕”了。[51]然而,“当前的计算模式——将晶体管集成到硅的二维晶片上(集成电路)——就是最终的计算模式,并且本身不能通过其他方法改进”这一假设很有可能是错误的。历史、市场力量和常识都表明并非如此。在使用集成电路之前,计算机是单纯用晶体管组成的。在此之前,即阿兰·图灵(Alan Turing)的时代,人们依靠电子管、继电器和电机机械来造电脑。计算的故事是一系列越来越强大的信息处理方法的故事,每一种方法都经历了几何级数的发展,随后达到其物理极限,然后就被更优秀的方法取代。计算处理能力的几何级数增长可以追溯到17世纪的“帕斯卡尔机械装置”。[52]没有什么是不可避免的,但对于摩尔定律来说,它并未随着集成电路的开始而开始,也不太可能随着集成电路的结束而结束。

接下来会发生什么才更吸引人。许多新方法已经在开发中,旨在达到基于硅片的计算的前沿并超越它。一种方法是首次在芯片中使用非硅材料。[53]另一种可能性则是脱离当前2D集成电路(晶体管被并排排列在一张硅晶片上)的范式,转为一种3D的方法——把硅晶片叠高。[54]一种方法可能是完全放弃硅这种材料,转而采用碳纳米管作为材料来构建体积更小、效率更高的晶体管。[55]目前还有一种方法被谷歌采用,即使用更多拥有特定目的的计算机芯片来实现特定的功能——功能更少,速度更快。[56]微软正加大对一种可以兼顾更高速度和灵活性的芯片的使用力度。[57]

放眼更长远的未来,来自谷歌和其他公司的工程师已经在努力开发“量子计算机”了,在处理某些任务上,“量子计算机”的功能预计将可以远超经典计算机。[58]另一种可能的替代硅的方法是使用2D类石墨烯状化合物和“自旋电子学”材料——利用电子的旋转来计算,而非移动它们。[59]神经电子学是另一个不断发展的领域,旨在对人脑的神经网络进行逆向工程,需要的功率或许比硅更少。[60]从长远来看,量子点细胞自动机(QDCA)技术可能产生难以想象的小体积半导体,这种半导体能够在使用远少于硅的功率和耗能的情况下,完成晶体管的工作。[61]

以上提到的许多技术仍处于起步阶段,对于摩尔定律的未来表现,现在还难有定论。最不可能的结果是计算机科学停滞不前,野心勃勃的年轻硅谷工程师只得放下手中的电路板,走上退休之路。无论下一代计算模式为何,假设算力还会继续以其自四百年前帕斯卡尔发明计算器起的发展速率成长,显然就不太合理了。