人工智能的未来
上QQ阅读APP看书,第一时间看更新

引言

洞悉人类思维的奥秘

大脑,比天空辽阔

因为,把它们放在一起

一个能包含另一个

轻易,而且,还能容你

大脑,比海洋更深

因为,对比它们,蓝对蓝

一个能吸收另一个

像水桶,也像,海绵

大脑,和上帝相等

因为,称一称,一磅对一磅

它们,如果有区别

就像音节,不同于音响该译文选用的是当代中国知名翻译家江枫先生的译稿。——编者注

艾米莉·狄金森,美国传奇诗人

智能可以超越自然的局限,并依照自身的意志改变世界,这恐怕是世间最了不起的奇迹了。人类智能可以帮助我们克服生物遗传的局限,并在这一进程中改变自我。而且在所有物种中,唯有人类能够做到这一点。

人类智能之所以能够产生与发展,源于这个世界是一个可以对信息进行编码的世界。宇宙为何如此运转,这本身就是一个有趣的故事。物理学的标准模型标准模型是一套描述强力、弱力及电磁力这三种基本力及组成所有物质的基本粒子的理论,该理论被认为是理解宇宙起源和物质构成的最基本原理。如作者所言,该模型中包含了许多参数,如各粒子的质量和相互作用的强度,不能由理论推导计算得出,必须由实验决定,而且这些参数必须要非常精确才能够恰到好处地产生我们观测的原子和观测原子的我们。——译者注会有数十个常量需要被精准限定,否则无法产生原子,也就不会有所谓的恒星、行星、大脑,更不会有关于大脑的书籍。让人不可思议的是,物理学定律及常数能够精确到如此程度,以至于允许信息自身得以演化发展。当然,根据人择原理人择原理(anthropic principle)指出,我们之所以活在一个各种自然常数调控得如此准确,以至于能孕育我们所知的生命的宇宙之中,是因为如果宇宙不是调控得如此准确,人类便不会存在,更遑论观察和谈论宇宙的起源。——译者注,如果不是这般精确,就没有我们在这里谈古论今。在某些人眼中,上帝创造了这个世界,而在另一些人眼中,这个世界不过是无穷多可能的平行宇宙平行宇宙论,或称多重宇宙论,是指一种尚未被证实的物理理论,其中我们所在的宇宙只是若干可能宇宙的一员。——译者注中具有丰富信息的一员——那些没有信息的无聊宇宙可能已经在演化过程中消亡了。不过,无论我们的宇宙是如何进化到如今的模样的,故事依然可以从基于信息的世界开始。

进化故事从越来越多的抽象层面展开。原子——特别是碳原子,它能够通过4种不同的方式相联结,创造丰富的信息结构,然后形成更多复杂分子。结果,物理学催生了化学。

10亿年后,一种被称为DNA的复杂分子逐步进化完成,它能精确编码长串的信息,并按照这些“程序”编译出生物。由此,化学催生了生物学。

生物体以快速增长的速率进化出了神经系统——交流与决策网络。我们通过它协调越来越复杂的生理结构和行为。神经元组成的神经系统聚合成了能够实施智慧行为的大脑。这样,随着大脑成为储存与处理信息的前沿,生物学就催生了神经学。从原子到分子,到DNA,再到大脑,再进一步就是独一无二的人类。

哺乳动物的大脑有一种特有的天赋,而这种天赋在其他类别的物种中尚未被发现。我们可能会根据等级高低来思量或理解由多种成分组成的结构。在这种结构中,各种不同的分子是按照同一模式排列的,这一排列模式同时也是一种符号,之后该符号将会作为一种分子被用于更复杂的结构中。这种能力产生于一种被称为大脑新皮质的结构中,就人类而言,该能力更为复杂、更具潜力,因此,我们可以将此类模式称为想法。通过永无休止的循环过程,我们可以构建更为复杂的想法,我们将此类浩大的递归链接的想法称为认知。认知基础是智人才有的,而且认知基于其本身进行演化、呈指数级增长并代代相传下去。

人类的大脑则产生了另一层级的抽象意识,因为我们在利用大脑智能的同时还具备另一种有利因素(一种与之相对的附属物)—— 手,通过对环境的掌控,我们用手来制造工具。这些工具代表着一种新形式的演变,技术由此产生。也正是基于这些工具,我们的认知基础才得以无限发展。

我们的第一个发明是口语,它使我们能够用不同的话语来表达心中想法。随后发明的书面语言,使我们能够用不同的形式来表达我们的想法。书面语言库极大地扩展了我们无外力援助的大脑的能力,使我们能够维持并扩充我们的认知基础,这是一种递归结构化的思想。

其他物种,如黑猩猩,在言语表达上是否也具有分级思想,这一问题仍存在争议。黑猩猩能够学会有限的手语符号,它们可以使用这些符号与人类训练员进行沟通。然而,就黑猩猩能够处理的认知结构而言,其复杂性还是有不同限制的,这也是显而易见的。它们能够表达的语言仅限于简单的名词-动词语序的句子,而不能表达复杂事物的无限扩展,而这是人类的特性。关于人类语言的复杂性,有这样一个有趣的例子:加西亚·马尔克斯所写的故事或小说中有许多惊人的长句子,甚至一个句子就有几页长——他曾写过一个6页篇幅的故事《最后的鬼魂之旅》(The Last Voyage of the Ghost),通篇就只有一个简单句(这个故事的西班牙语版本和英语版本都翻译得很好);拜读过他的大作《百年孤独》的读者肯定对文中大段大段的长句描写印象深刻!

我之前出版过3本有关技术的书,其中,《智能机器时代》(Age of Intelligent Machines),写于20世纪80年代,出版于1989年;《灵魂机器时代》(Age of Spiritual Machines),写于90年代中期到末期,出版于1999年;《奇点临近》,写于21世纪初,出版于2005年,其主要思想是关于一个固有的不断加快的演化进程(因抽象意识水平的不断提升而导致),以及其产物的复杂性和能力的指数级增长。人们将这种现象称为加速回报定律(LOAR),该定律与生物和技术的演化有关。关于LOAR有一个最生动的例子,即信息技术能力和性价比都指数级发展,而且这种发展速度是可预测的。技术演化进程不可避免地导致计算机能力的进化,反过来又扩展了我们的认知基础,使我们能够通过某一领域知识的广泛联系来了解另一领域的知识。网络本身就为等级划分系统的能力提供了一个强有力的恰当例子,网络包含大量的知识,同时又维持了其内在的结构。世界本身就是按等级划分的——树有枝、枝有叶、叶有脉,建筑有楼层,楼层有房间,房间有门、窗户、墙壁和地板。

我们还开发了其他工具,通过利用这些工具,我们现在能用精确的信息术语来理解人类的生物学。我们正以极快的速度利用逆向工程法分析生物学的构成信息,包括大脑结构的信息。我们现在拥有以人类基因组形式存在的生命目标代码,这项成就本身也是指数级发展的一个突出实例。过去的20年间,世界已测序的基因数据量呈指数级增长,每年增加了近一倍(见第10章)。现在,我们可以通过计算机模拟来判断有碱基序列是如何形成氨基酸序列,从而折叠成三维蛋白质的。1计算机资源持续呈指数级增长,我们就蛋白质折叠复杂性的模拟能力也在稳步提高。

现在有一项涉及成千上万位科学家和工程师的宏伟工程正在进行中,他们正致力于理解智能程序的最好范例——人类大脑。这可以说是人造机器文明史上最为重要的工作。在《奇点临近》一书中,我根据加速回报定律得出的一个推论是,不可能存在另一种智能物种。总结来说,就是考虑在短暂的时间内,我们能做到从只具备落后技术(试想在1850年,全美范围内送信最快捷的方式是通过驿马快信[Pony Express])到拥有能到达其他星球的技术,那么,如果有其他智能物种存在,我们应该早就发现了。从这个角度看,对人类大脑实施逆向工程可能是世界上最重要的项目了。

这项工程的目标是精确理解人类大脑的运作机制,然后通过这些已知的方法来更好地了解我们自身,并在必要的时候修复大脑,而与本书最密切相关的,就是利用这些信息创造出更加智能的机器。我们必须牢记,工程学能做的就是将一种自然现象明显放大。想想伯努利定律伯努利定律是由“流体力学之父”丹尼尔·伯努利发现的,是指在一个流体系统中,流速越快,流体产生的压力就越小。——编者注这一相当微妙的现象,它指出,运动的弯曲表面比运动的平坦表面的空气压力要小。虽然科学家们仍没有充分解决关于伯努利定律如何制造机翼升力的数学问题,但是工程学已经接受了这个精妙的观点,并集中全力开创了整个航空界。

在本书中,我提出了思维模式识别理论(Pattern Recognition Theory of Mind, PRTM),我认为它描述了大脑新皮质(主要负责感知、记忆和判断思维的大脑区域)的基本算法。在书中前几章,我描述了近代神经科学研究和人类自身的思想实验导致的不可避免的结果:这种方法一直被用在大脑新皮质上。思维模式识别理论和加速回报定律的含义就是我们能设计这些原则来广泛传播人类智能的力量。

实际上,这项措施已在进行中。以前专属于人类智能的许多任务以及活动,现在能完全由电脑控制,更加精确,范围也扩大了。每次发邮件或打电话,智能算法都能合理地追踪信息。有时候,心电图测出的结果和医生的诊断结果恰好相反。在血细胞图像中,也有可能出现这样的情况。智能算法能自动识别伪造的信用卡、能驾驶飞机的起飞和降落、能指导智能武器系统、能帮助设计计算机辅助设计的产品、能及时追踪库存水平,还能在机器人工厂里组装产品。它还会下国际象棋,甚至参加大师级水平的围棋比赛。

几百万人都见识了IBM那台名叫“沃森”的超级计算机在《危险边缘》这个语言类益智问答比赛节目中的表现,总的得分比世界上两个玩得最好的人的总分还要高。值得注意的是,沃森不仅能读懂和理解《危险边缘》中的提问,还能理解包含双关语和比喻,并能从广阔的知识面(比如说维基百科或其他百科知识)汲取答案所需的知识。它得对人类的各种文化活动了如指掌,比如历史、科学、文学、艺术、文化等。现在IBM正同Nuance Speech Technologies公司(之前名为“库兹韦尔计算机产品公司”[Kurzwiel Computer Products],是我创办的一家公司)一起,致力于在新一代的沃森电脑上开发文字语音自然转换技术。新一代沃森电脑,通过Nuance公司的临床语言理解技术,能阅读医学文献(几乎所有的医学期刊和领先的医学博客),成为大师级的诊疗医师和医学咨询师。一些观察者指出,沃森没有真正理解《危险边缘》节目或它所阅读过的百科全书,因为它只是在进行“统计分析”。这里我所要描述的关键是人工智能领域所涉及的数学技术(比如这些被应用在沃森、iPhone手机助手Siri上的技术),它们在数学上与大脑新皮质中涉及的生物学形式的方法非常相似。如果通过统计分析理解语言和其他现象不能得出正确的理解,那么人类也无法真正理解。

沃森运用自身的智能掌握自然语言文件中的知识,这使它很快就会商品化,成为你身边的一种搜索引擎。人们已经在用自然语言与他们的手机对话(比如通过Siri,当然这也是在Nuance语音识别技术的帮助下)。当它们更多地使用沃森模式,并且沃森本身也在不断改进时,这些自然语言辅助工具将很快变得更智能。

谷歌的无人驾驶汽车已经在加利福尼亚州繁忙的城市中行驶了32万多公里(当这本书上架的时候,这个数字肯定会高得多)。当今世界还有很多其他人工智能的例子,未来肯定还会出现更多。

再拿加速回报定律举例,大脑扫描的空间分辨率以及大脑正在收集的数据每年都在成倍递增。我们也在证明我们可以将这个数据转变成大脑区域的运作模式和模拟系统。我们已经在用于处理声音信息的听力皮质、处理图像的视觉皮质和处理一部分技能形成的小脑(比如抓住一个正在飞的球)等关键功能的逆向工程中取得了成功。

理解、建模和模拟人类大脑的关键是对大脑新皮质实施逆向工程,而大脑新皮质是我们进行循环分层思考的部位。大脑新皮质占据人脑的80%,并高度重复结构化,所以人们可以随意生成有复杂结构的想法。

在思维的模式识别理论中,我描述了一个模型,关于人脑怎样使用通过生物进化形成的非常清晰的结构,来达成思维模式识别这个重要的能力。虽然在皮质运作机制中有些细节我们现在还不能完全弄明白,但是我们对皮质运作机制需要的功能的了解却已经足够多,并可以设计算法以达到相同的目的。在开始理解新皮质时,我们就可以极大地增强它的能力,正如航空界极大地增强了伯努利原理的力量。新皮质的运作原理已被证明是世界上最重要的思想,因为它能够呈现所有的知识和技能,并可以创造新的知识。毕竟,是新皮质创造了每一部小说、每首歌、每幅画、每个科学发现,以及其他人类思想的各种各样的产物。

在神经系统科学领域急需一个理论,将每天正在报道的极端分散和广泛的活动结合起来。统一理论在每一个重要的科学领域都是关键要求。在第1章我会描述两位“思想实验”家怎样把生物和物理统一起来——在此之前这两个领域是极其混乱多变的。然后我会解释这个理论怎样被运用到大脑的结构中。

现在我们经常会大力赞赏人类大脑的复杂性。谷歌为一个要求评论这个话题的调查反馈了大约3000万条链接(我们无法在这儿转述反馈的真实评论的数量,因为有些链接的网站有很多评论,有些则一个也没有)。“DNA之父”詹姆斯·沃森(James Watson)在1992年写道:“大脑是最新、最伟大的生物前沿领域,是我们在宇宙中发现的最为复杂的东西。”他进一步解释了为什么自己相信“它包含上千亿细胞,它们内部通过上万亿节点联结,大脑使我们深感困惑”。2

我同意沃森关于大脑是最伟大的生物前沿领域的看法,但如果我们可以轻易地辨别出包含在细胞和节点中的易理解的(并可以再创造的)模式,它所包含的数十亿细胞和数万亿节点并不一定会使它的主要研究方法变得更复杂,尤其是在大量冗余模式存在的情况下。

让我们想一下什么叫“复杂”。森林复杂吗?答案取决于你看问题的角度。你会发现森林里有成百上千棵树,每一棵都不同。你又会发现每一棵树有成百上千的树枝,每个树枝也完全不同。你会进一步描述每个树枝的复杂特性。你的结论可能是:森林的复杂性远远超乎我们的想象。

但是,把森林看成很多树的方式其实是错误的。当然,树和树枝在部分上有极大的不同,但要正确理解森林的概念,你最好先辨别出已找到的具有随机变量的冗余模式。这样才可以说森林的概念比树的概念简单得多。

大脑也是如此。它有一个类似的庞大的冗余组织,尤其是在新皮质结构中。就像我会在这本书里解释的,我们甚至可以说单个神经的复杂程度超过了整个新皮质结构的复杂程度。

我写这本书的目的并不是对人脑复杂性的老生常谈,而是为了揭开人脑最基本的力量,包括其基本智力系统如何进行识别、记忆、预测。这些行为在新皮质里不断重复,产生了各种不同的想法。

核基因与粒线体基因里的遗传密码所组合出的生物多样性令人惊异,新皮质思想模式识别感知器里的格局联结及突触所产生的意见、思想及技巧也同样令人叹为观止。麻省理工学院神经学家塞巴斯蒂安·尚博士(Sebastian Seung)相信:“基因无法决定一切,大脑神经元的联结才是人类身为智慧生物的最重要部分。”3

我们必须懂得分辨真正的构造复杂性和表面复杂性。曼德布罗特集曼德布罗特集(Mandelbrot set)是在复平面上组成分形的点的集合。——编者注的图像因其复杂性而闻名(见图0-1)。为理解其表面复杂性,我们可以将图像放大,其中的错综复杂不计其数,且都不尽相同,但曼德布罗特集的设计及公式却非常简单:Z=Z2+C。其中,Z代表复数(一对数字), C代表常量。

图0-1 曼德布罗特集的范例

注:只要将图片放大,图像表面的复杂性将不断变化。

我们不需要通过研究曼德布罗特集的功能来证明它的简单性,此公式在不同阶段会一直被反复使用,这和人脑是一样的。其不断重复的构造并不像曼德布洛特集的公式那么简单,但也不如一般有关人脑的书籍所说的那么复杂。新皮质构造在每个概念阶层不断重复。爱因斯坦曾说过:“任何一个聪明的蠢材都可以把事情搞得更大、更复杂,也更激烈。但往相反的方向化繁为简则需要很大的勇气。”

至此,我已经谈了很多关于大脑的事情。然而,思维是什么呢?比如,负责解决难题的新皮质是如何获得意识的呢?当我们讨论这个话题时,有多少种思维在我们的大脑里正激荡呢?有证据表明,可能不止一个。

另一个与思维相关的问题是:什么是自由意志,我们是否拥有自由意志?有实验表明,在意识到自身的决定之前,我们已经开始采取行动了。这是否意味着自由意志只是一种幻觉?

最后,我们还要问:大脑里的哪些特点造就了我们的特性?我还是6个月前的“我”吗?显然我已经不是以前的“我”,那我还是“我”吗?

让我们来看看思维模式识别理论是如何解释这些存在已久的问题的。

扫码关注“庐客汇”,回复“人工智能的未来”,即可直达库兹韦尔“科技将如何改造我们”的TED演讲。