人工智能导论
上QQ阅读APP看书,第一时间看更新

1.4 人工智能的主流学派

专家系统的运作需要从外界获得大量知识的输入,而这样的输入工作是极其费时费力的,这就是知识获取的瓶颈。在20世纪80年代,原本处于人工智能边缘的分支——机器学习,一下子成为人们关注的焦点,快速促进了人工智能的应用发展。

早期的人工智能研究者奋力研究,并未取得巨大进步,但是他们很快发现,如果采用完全不同的思路,即让知识通过“自下而上的方式涌现”,而不是让专家们自上而下地设计出来,那么机器学习的问题其实可以得到很好地解决。正如人类的教育方式,早期人工智能仿佛是填鸭式教学,让机器被动式接受知识,而机器学习的方法则是启发式教学,让机器自己来学。

在人工智能学界,很早就有人提出过自下而上地涌现智能的方案,只不过这从来没有引起大家的注意。一批人认为可以通过仿真大脑的结构(神经网络)来实现,而另一批人则认为可以从那些简单生物体与环境互动的模式中寻找答案,他们分别被称为连接学派和行为学派。与此相对,早期的人工智能则被统称为符号学派。自20世纪80年代开始,到20世纪90年代,这三大学派形成了三足鼎立的局面。

1.4.1 符号学派:物理符号系统假说

人工智能的创始人之一约翰·麦卡锡是符号学派的典型代表,他曾经发表了一篇文章《什么是人工智能》,按照符号学派的理解方式为大家阐明什么是人工智能。

约翰·麦卡锡的观点是“人工智能是关于如何制造智能机器,特别是智能的计算机程序的科学和工程。它与使用机器来理解人类智能密切相关,但人工智能的研究并不需要局限于生物学上可观察到的那些方法”。

麦卡锡特意强调人工智能研究并不一定局限于仿真真实的生物智能行为,而是更强调它的智能行为和表现的方面,这一点和图灵测试的想法是一脉相承的。

另外,麦卡锡还突出了利用计算机程序来仿真智能的方法。他认为,智能是一种特殊的软件,与实现它的硬件并没有太大的关系。

Newell和Simon则把这种观点概括为“物理符号系统假说”(Physical Symbol System Hypothesis)。该假说认为,任何能够将物理的某些模式(pattern)或符号进行操作并转化成另外一些模式或符号的系统,就有可能产生智能的行为。

这种物理符号可以是通过高低电位的组成或者是灯泡的亮灭所形成的霓虹灯图案,当然也可以是人脑神经网络上的电脉冲信号。这也就是“符号学派”得名的由来。

在“物理符号系统假说”的支持下,符号学派把焦点集中在人类智能的高级行为上,如推理、规划、知识表示等方面。

人机大战是符号学派的典型应用。1988年,IBM开始研发可以与人下国际象棋的智能程序“深思”——一个可以以每秒70万步棋的速度进行思考的超级程序。到了1991年,“深思II”已经可以战平澳大利亚国际象棋冠军达瑞尔·约翰森(Darryl Johansen)。1996年,“深思”的升级版“深蓝”开始挑战著名的国际象棋世界冠军卡斯帕罗夫,却以2∶4败下阵来。但是,一年后的5月11日,“深蓝”最终以3.5∶2.5的成绩战胜了卡斯帕罗夫,成了人工智能发展史上的一座里程碑。

1.4.2 连接学派

连接学派认为人类的智慧主要来源于大脑的活动,而大脑则是由上万亿个神经元细胞通过错综复杂的相互连接形成的,人们可以通过仿真大量神经元的集体活动来仿真大脑的智力。而这种错综复杂的连接,称之为神经网络。

相比物理符号系统假说,人们不难发现,如果将智力活动比喻成一款软件,那么支撑这些活动的大脑神经网络就是相应的硬件。主张神经网络研究的科学家实际上在强调硬件的作用,认为高级的智能行为是从大量神经网络的连接中自发出现的。

神经网络具有麦卡洛克-匹兹模型、感知机和多层感知机三种模型。

1.麦卡洛克-匹兹模型

1943年,沃伦·麦卡洛克(Warren McCulloch)和沃尔特·匹兹(Walter Pitts)二人提出了一个单个神经元的计算模型(也叫麦卡洛克-匹兹模型),见图1-12。

图1-12 麦卡洛克-匹兹模型

在这个模型中,左边的I1,I2, … ,IN为输入单元,可以接受其他神经元的输出,然后将这些信号经过加权(W1,W2, … ,WN)传递给当前的神经元并完成汇总。如果汇总的输入信息强度超过了一定的阈值(T),则该神经元就会发放一个信号y给其他神经元或者直接输出到外界。

2.感知机

1957年,弗兰克·罗森布拉特(Frank Rosenblatt)在麦卡洛克-匹兹模型的基础上加入了学习算法,该模型命名为感知机,感知机可以根据模型的输出y与期望模型的输出y* 之间的误差,调整权重(W1,W2, … ,WN)来完成学习。

可以形象地把感知机模型理解为一个装满了大大小小水龙头(W1,W2, … ,WN)的水管网络,学习算法可以通过调节这些水龙头来控制最终输出的水流,并让它达到人们想要的流量,这就是学习的过程。

感知机的提出者认为感知机不管遇到什么问题,只要明确了输入和输出之间的关系,都可以通过学习来解决。但1969年,人工智能界的权威人士马文·明斯基通过理论指出,感知机不可能学习任何问题,连一个最简单的问题“判断一个两位数的二进制数是否包含0或1(即XOR)”都无法完成。

3.多层感知机

为了解决弗兰克·罗森布拉特提出的感知机存在的问题,杰弗里·辛顿采用“多则不同”的方法,只要把多个感知机连接成一个分层的网络(见图1-13),就可以圆满地解决明斯基提出的问题——感知机不可能学习任何问题。在多层感知机里有很多个神经元,在学习过程有几百甚至上千个参数需要调节,辛顿等人发现,采用阿瑟·布莱森提出的反向传播(Back Propagation, BP)算法就可以解决“多层网络训练问题”,从而学习任何一个问题。

图1-13 多层感知机

其中,反向传播算法是一种常用的传播算法。以水流管道为例来进行说明,核心思想有两点,一是当网络执行决策的时候,水从左侧的输入节点往右流,直到输出节点将水吐出;二是在训练阶段,则需要从右往左一层层的调节水龙头,要使水流量达到要求,只要让每一层的调节只对它右面一层负责就可以了,实现反向修正感知机的参数。

以多层感知机为原型,经过多年的研究,产生了人工智能学习算法,如CNN、RNN等。连接主义的代表性成果是由麦卡洛克和匹兹提出的形式化神经元模型,即M-P模型,从此开创了神经计算的时代,为人工智能创造了一条用电子装置模仿人脑结构和功能的新途径。1982年,美国物理学家霍普菲尔特提出了离散的神经网络模型,1984年他又提出了连续的神经网络模型,使神经网络可以用电子线路来仿真,开拓了神经网络用于计算机的新途径。

1.4.3 行为学派

行为学派又称进化或控制论学派,是一种基于“感知——行动”的行为智能模拟方法。该学派最早来源于20世纪初的一个心理学流派,认为行为是有机体用于适应环境变化的各种身体反应的组合,它的理论目标在于预见和控制行为。

维纳和麦洛克等人提出的控制论和自组织系统以及钱学森等人提出的工程控制论和生物控制论,影响了许多领域。控制论把神经系统的工作原理与信息理论、控制理论、逻辑以及计算机联系起来。早期的研究工作重点是模拟人在控制过程中的智能行为和作用,对自寻优、自适应、自校正、自镇定、自组织和自学习等控制论系统进行研究,并进行“控制动物”的研制。到20世纪60~70年代,上述控制论系统的研究取得一定进展,并在20世纪80年代诞生了智能控制和智能机器人系统。

行为主义学派的智能控制和智能机器人系统的构造原理如图1-14所示,机器的智能行为输出源自于响应机对感知机输入的分析,为了能极大感受环境并提高执行能力,在感知机和响应器间专设了各种模块,如探索、漫游、避障等。

布鲁克斯根据图1-14的原理制造出的六足行走机器人被推为行为主义学派的代表作,它被看作新一代的“控制论动物”,是一个基于“感知—动作”模式的模拟昆虫行为的控制系统。布鲁克斯认为要求机器人像人一样去思维太困难了,在做一个像样的机器人之前,不如先做一个像样的机器虫,由机器虫慢慢进化,或许可以做出机器人。

布鲁克斯在美国麻省理工学院的人工智能实验室研制成功了一个由150个传感器和23个执行器构成的像蝗虫一样能实现六足行走的机器人试验系统,见图1-15。这个机器人虽然不具有像人那样的推理、规划能力,但其应付复杂环境的能力却大大超过了原有的机器人,在自然(非结构化)环境下,具有灵活的防碰撞和漫游行为能力。

图1-14 行为主义的智能系统构造原理

图1-15 六足行走的机器人

1.4.4 三大学派的比较

符号、连接和行为学派从不同的角度来智能地探索大自然,与人脑思维模型有密切关系。符号学派研究抽象思维,连接学派研究形象思维,而行为学派研究感知思维,各有各的特点,见表1-1。

表1-1 符号、连接和行为学派的比较