机器意识:人工智能如何为机器人装上大脑
上QQ阅读APP看书,第一时间看更新

2.6.2 意义问题——符号接地问题

20世纪80年代,Searle提出了一个思想实验,可以被表述为:假设在不久的将来,人工智能已经发展出能理解中文的人工主体,它也能通过图灵测试,至少在文本和语音内容上,与人类的反应相比,输出结果是无法区分的。因此,这样的AI能够使任何一个中国人相信,它也是一个说中文的人类。Searle的问题是:“这个主体真的‘理解'中文吗(强人工智能)?还是仅仅是模拟理解中文的能力(弱人工智能)?”因为该主体通过把输入和在程序脚本中给出的语法规则联系在一起产生输出,但没有真正掌握语义,就像目前的翻译软件一样,如图2.30所示。结论是程序脚本不能促生“意识”,但是能够尽可能地完成模仿,因此强人工智能不可能存在。

符号接地问题和Searle的中文屋问题紧密相关。它的缺陷是需要将语言标签,如单词和语法(符号),与实际样子联系起来。例如,设想一个机器人,它的前方有一个球。这个机器人会无法把单词(符号)与这个对象(样子)联系起来,一旦被给出像“捡起球”这样的指令时,它将无法执行这个任务。人类克服了这个问题,因为人类认知是通过神经学习发展起来,并通过逐渐熟悉环境和已知的社会规范培养的。

图2.30 谷歌翻译和类似的翻译软件用的是更快的字典搜索,而不是试图理解语言(其语义和文化方面)。机器学习算法可以通过观察模式轻松地翻译字母、单词和句子。相比之下,人类翻译人员需要学习语言,而不仅仅联系符号以形成语义。正如Searle所说,计算机只会操作符号,不会理解语义。因此,强人工智能并不存在,任何人工手段都不能取代人类认知

符号接地问题探讨了“机器人能处理符号接地吗”?或者“机器人能识别、表达和交流世界信息吗”?工程师和设计师们已经能够让机器人应用强度启发式学习或图像处理,从而识别出图像或者视频中的单词。然而,这仅限于选定的一组已知对象,并倾向于为特定的工作定制机器人,牺牲了情境,因而也就牺牲了它在其他工作和意外发现活动(如探索与发现)中的多功能性。因此,机器人可以被编程来通过其感觉运动具身与现实的符号接地交互和操作,但是明显缺乏普适性。

Harnad[142]提出,符号接地问题比起只是通过将图像与名称联系起来(如图2.31所示)开发出某种机器人词典更引人注目。处理符号接地应该是机器人自主地、广泛地将符号与世界联系起来以建立符号网络的能力。因此,符号接地现象为意识行为设定了优先级,这里意识状态是至关重要的。

图2.31 符号接地问题的一个很差的解决方案。符号接地问题的一个明显、粗鲁的解决方案是标记所有事物。然而,这仍然不足以开发出所有的符号关系,并赋予对象意义

解决符号接地问题

解决这个问题的尝试,已经经历了从近似解到完全否定,再到将其作为人类认知的一个固有问题接受。

1.近似解:解决符号接地问题最明显的方法是监督学习。将语言与视觉模式结合的实验已经表明了行为的逐渐优化。然而,这只是一个很好的近似,只是拓宽了视野,并没有解决问题。

2.避免低级行为:这个对计算机来说似乎有严重影响的问题,对机器人来说却无关紧要,或者充其量只是一个可以安全避免的哲学问题。对于具身人工智能来说,其职责更多的是构建和操纵符号,而不是真正地让它们接地。由于机器人是局限性的,物体和动作的意义可以逐步地确定,或者如果对机器人来说无关紧要,则可以完全忽略。例如,一个进行低级别行为的机器人面对的障碍物是一本书、一块砖还是一个盒子,对它来说几乎没有什么意义,它所要做的全部就是避开这些障碍物而已。因此在具身认知中,符号接地问题与其说是一个认知问题,不如说是一个技术问题,Vogt[340]称之为“物理符号接地问题”。

3.作为人类认知的哲学局限:对意义的需求属于高级的认知。当尝试为机器人制订解决方案时,符号关系和对象的意义会被仔细地映射出来然后由人类程序员编码。其中大多数是基于人类语义和文化的,而不是像问题定义所期望的那样由人工智能体自主建立的。因此,这种解决方案偏重于人类知识和推理,而不是自主智能体的裁断。

Touretzky[324]提出了一个“中文屋问题的机器人版本”,通过使用机器人而不是电脑来反驳Searle的观点。修正中文屋问题为,假设有一个机器人,能通过图灵测试,能大胆地说地道的中文,问到的问题是“走到窗户边,告诉我你看到了什么”?这里,视觉感知将是一种对心理意象的探究,可能并不会有所期望的人类反应,即机器人可能无法感知天空是蓝色的,或者阳光是温暖的等。因此说明了中文屋问题可以用具身主体来克服。这是图灵测试的一个版本,我们会在第9章进一步讨论这样的方法。

对于低级行为机器人来说,符号接地几乎不是问题,但对于开发高级的认知功能来实现类人行为来说,这将是一个问题。将符号与现实世界联系起来的缺陷并不是机器人独有的问题,我们人类也经常会遇到。例如,当我们遇到来自不同生物群系的水果和蔬菜时,我们很多人都会产生疑问,于是我们求助于互联网上的在线搜索。

赋予一个对象意义的思路和解析它们的思路往往是不一样的。因此,高级认知功能中的意义总是与语境相关的,并且会随着感知、记忆、训练、认知偏差等的不同而不同。因此,符号接地问题将永远不能被解决[79,310],但可以通过以下三点有效地减少:(1)知识划分,通常见于定位和情境驱动的任务,如在导航上可以是:标记目标点,去往红色标记处,穿过3个固定的障碍物等;(2)机器学习;(3)既然我们处于互联网时代,可以使用在线知识库来搜索给定对象或实例的适当意义。