1.2 人工智能研究的目标及内容
1.2.1 人工智能的研究目标
作为工程技术学科,人工智能的研究目标是提出建造人工智能系统的新技术、新方法和新理论,并在此基础上研制出具有智能行为的计算机系统。现有的计算机不仅可以对数值信息进行一般的数值计算和数据处理,还可以利用知识解决问题,模拟人的一些功能行为。作为理论研究学科,人工智能的研究目标是提出能够描述和解释智能行为的概念与理论,为建立人工智能系统提供理论依据。
其实,对人工智能的研究,最终需要的是将这门技术依托于某种载体来实现,并为生活带来实际的良好体验,拓展出无限的可能,逐渐改变人类的生活方式。通俗地说,就是一方面能够更好地理解人类智能,通过编写程序来模仿和检验有关人类智能的理论;另一方面,创造有用灵巧的程序,该程序能够执行一般需要人类专家才能实现的任务。
1.2.2 人工智能的研究内容
人工智能理论在不断深入研究中得到了发展,向着更为宽广的应用领域迈进,也获得了更重要的应用结果。从应用的角度看,人工智能的研究主要集中在以下几个方面。
1.专家系统
专家系统具有丰富的专业知识和经验。基于人工智能技术,通过一个或多个人类专家在某一个领域提供的知识和经验用于推理和判断,并采用类似于人类专家的决策过程,以解决那些需要专家决定的复杂问题。专家系统通常需要利用已知的现有算法来解决问题,但有些问题无法解决,因为给出的信息通常是不完全、不精确,甚至是不确定的。它可以解决一些问题,如一般性的解释、预测、诊断、设计、规划、监测、修复、指导和控制。从架构上看,专家系统可分为集中专家系统、分布式专家系统、协同专家系统、神经网络专家系统等,从实现方法上可以分为基于规则的专家系统、基于模型的专家系统、基于框架的专家系统等。
2.自然语言理解
自然语言理解就是研究如何在人与计算机之间利用自然语言建立起有效的通信。由于目前计算机系统与人类之间的交互还只能使用严格限制的各种非自然语言,因此,解决计算机系统能够理解自然语言的问题一直是人工智能领域的重要研究课题之一。
实现人与计算机之间的自然语言沟通,是指计算机系统可以理解自然语言文本及自然语言文本的含义,还能够理解人类想要表达的特定意图和想法。如何正确理解并准确表达语言是一个极其复杂的解码和编码过程。能够做到理解口语和书面语言的计算机系统不但需要有一些代表语境知识的结构,还需要积累一些基于这些知识的推理技巧。
虽然在理解有限范围的自然语言对话和理解用自然语言表达的小段文章或故事方面的程序系统已有一定的进展,但要实现功能较强的理解系统仍十分困难。从目前的理论和技术现状看,自然语言理解系统主要应用于机器翻译、自动文摘、全文检索等方面,而通用的和高质量的自然语言处理系统,仍然是较长期的努力目标。
3.机器学习
学习是人类智能的主要标志和获得知识的基本手段,也是可以知识获取的具有特定目的的过程。在内部性能的不断建立和修改的同时,外部性能也在不断提高。机器学习是指自动获取新事实和新推理算法的过程,这是使计算机智能化的基本方法,也是人工智能的一个核心研究领域,有助于发现人类学习的机理和揭示人脑的奥秘。
机器学习主要研究如何赋予机器自身获取知识的能力,使机器能够学会如何总结经验、纠正错误、发现模式、提高性能,并对环境有更强的适应性。就目前的研究来讲,机器学习通常可以解决以下问题。
(1)选择训练经验。比如,如何选择训练类型、选择训练样本、设计样本训练序列。
(2)选择目标函数。几乎所有机器学习问题都可以简化为学习特定目标函数的问题。由此可知,正确学习、设计和选择目标函数在机器学习领域是至关重要的。
(3)选择目标函数的表示。在面对特定应用问题的时候,首先要做的是确定理想目标函数,下一个任务则是从许多乃至无穷多个选择中找到最佳或近乎最佳的表示。目前,对机器学习的研究才刚刚起步,但这是一个值得投入很大精力去研究的方面。只有机器学习研究的进步才能使人工智能和知识工程研究方向获得突破性的发展。
4.自动定理证明
自动定理证明,又叫机器定理证明。它是数学和计算机科学相结合的研究课题。人类思维中演绎推理能力可以在数学定理的证明过程中得到淋漓尽致的体现。演绎推理实质上是符号运算,因此,原则上可以用机械化的方法来进行。1965年,罗宾逊提出了一阶谓词演算,这是自动定理证明的具有重大突破性进展的分辨率原则。1976年,美国Appel和其他人使用的高速计算机证明了124年来都没有得到解决的“四色问题”,这表明利用电子计算机有可能把人类思维领域中的演绎推理能力推进到前所未有的境界。1976年年底,中国数学家吴文俊开始对可判定问题进行初步探究。他成功地设计了一个决策算法和相应的程序,有效地解决了初等几何和初等微分几何中的某一大类问题,其研究处于国际领先地位。后来,我国数学家张景中等人进一步推导出“可读性证明”的机器证明方法,再一次轰动了国际学术界。
自动定理证明有着更深刻的理论价值,其应用范围也并不仅仅局限于数学领域,许多日常生活中非数学领域的任务,都可以经过一定的转化从而变成相应的定理证明问题,或者与定理证明相关的问题,所以自动定理证明的研究具有普适性的意义。
5.自动程序设计
自动编程是能够根据给定问题的原始描述自动生成满足要求的程序。它是软件工程和人工智能相结合的研究课题。自动编程主要包括程序综合和程序验证两个方面。前者实现自动编程,即用户只需要告诉机器“做什么”,而不需要告诉“怎么做”,后一步由机器自动完成。自动验证,也就是说,机器可以自主完成对正确性的检查。程序合成的基本方法是主要程序转换,即通过一步一步地将输入条件变换为输出,以形成所需要的程序。程序验证是使用经过验证的程序系统来自动证明给定程序的正确性。判断程序正确性有三种标准,即终止性、部分正确性和完全正确性。
目前在自动程序设计方面已取得一些初步的进展,尤其是程序变换技术已引起计算机科学工作者的重视。现在国外已陆续出现一些实验性的程序变换系统。
6.分布式人工智能
分布式人工智能结合了分布式计算和人工智能的特点。它提供了一种有效的方法来协调逻辑上或物理上分散的智能操作,解决单目标和多目标问题,以及设计和构建大规模复杂的智能系统或计算机以支持协同工作。它所能解决的问题需要整体互动所产生的整体智能来解决。分布式人工智能主要研究内容有分布式问题求解(Distribution Problem Solving,DPS)和多智能体系统(Multi-Agent System,MAS)。
7.机器人学
机器人学是机械结构学、传感技术和人工智能结合的产物。1948年,美国研制成功第一代遥控机械手,17年后第一台工业机器人诞生,此后相关的研究不断取得新的成果。机器人的发展经历了以下几个阶段:第一代为程序控制机器人,它通过反复的学习然后进行再现的方式,把人类从事笨重、繁杂与重复的劳动中逐步解放出来;第二代为自适应机器人,它可以通过自身的感觉传感器来获取作业环境的简单信息,还具有一定的环境适应能力,能够识别出操作对象的微小变化;第三代为分布式协同机器人,它的传感器具有视觉、听觉、触觉等多种功能,在多个方向平台上都能够感知到多维信息,它具有较高的灵敏度,能够精确感知到周围的环境信息,并进行实时分析,控制自己的多种行为,在自主学习、自主决策和自主判断的基础上处理环境中的变化,和其他机器人沟通交流。
从功能的角度来看,机器人技术的研究主要涉及两个方面:一是模式识别,即机器人配备可以识别空间场景的实体和阴影的视觉和触觉,甚至可以区分它们之间的细微差别;另一方面,机器人的运动协调推理可以看作在受到外部刺激后,机器人被驱动的过程。
机器人技术和人工智能之间相互促进,它可以建立一个世界国家模型,以进一步描述世界各国的变化过程。
8.模式识别
模式识别重要的研究内容是计算机的模式识别系统,它是信息科学人工智能的重要组成部分,使用计算机代替人类或帮助人类处理复杂的信息。我们通常把环境与客体成为“模式”,并利用物理、化学或生物的测量方法进行特定的采集和测量。模式所代表的不仅仅是事物本身,更重要的是通过一系列的信息处理过程从事物中获取信息,一般表现为具有时间和空间分布的信息。人类在观察、认识事物和现象时,常常对各种信息进行处理、分类和理解,而模式识别技术就是要模仿人脑的这种思维能力。
模式识别不断发展,一些具体应用遍及遥感、生物医学成像、工业产品的无损检测、指纹鉴定、文字和语音识别等领域。模式识别在气象领域也有着重要的应用,卫星云图在灾害性天气中起到重要的作用,如何从运途中提取有用的信息,惊云系结构和天气系统联系起来,对天气进行预测。语音识别技术是应用比较广泛的一种模式识别技术,特别是中小词汇量非特定语音识别系统精度已经高达98%,还可以对语种、乐种和方言来检索相关的语音信息。模式识别作为一个新兴学科正在不断成长,其理论基础在不断发展,研究范畴也在不断扩大。
9.博弈
计算机博弈主要是以搞对抗性的棋牌游戏为载体的研究。我们最早接触的计算机博弈就是跟电脑玩家下棋或者打牌,在20世纪60年代就出现了很有名的西洋跳棋和国际象棋程序。进入20世纪90年代,IBM公司支持开发了后来被称为“深蓝”的国际象棋系统,并针对此系统开发了专用的芯片,以提高计算机的搜索速度。“深蓝”与国际象棋世界冠军卡斯帕罗夫的交锋给人类留下了深刻的印象。
搜索策略、机器学习等问题都以博弈问题为实际背景才能够进行更加深入的研究,在此过程中,发展起来的一些概念和方法也为人工智能的其他问题提供了更有利的价值。
10.计算机视觉
视觉在制造业、检验、文档分析、医疗诊断和军事等众多领域中的智能系统中都起到至关重要的作用。计算机视觉涉及计算机科学与工程、信号处理、物理学、应用数学和统计学、神经生理学和认知科学等多个领域的知识,它不同于人工智能、图像处理和模式识别等相关学科,在逐步的研究中已成为一门独立而成熟的学科。让计算机能够像人一样观察和理解世界,并自主地适应环境的变化是计算机视觉研究的终极目标。计算机视觉参见图1-2。
图1-2 计算机视觉
计算机视觉是一门研究如何使计算机学会“看”世界的科学,也就是利用摄影机和电脑代替人眼对目标进行识别、跟踪、测量和处理,得到一个更容易识别的图像。这个研究领域成长迅速,已经衍生出一大批快速成长的实际应用,计算机视觉技术主要有以下5种。
(1)图像分类。这是一种基于数据驱动的图像分类方法,该算法并没有直接在低码中规定每个图像类别,而是为计算机提供示例,然后设计也学习算法,查看这些示例,并学习每个类别的视觉外观。
(2)对象检测。对象检测就是对图中感兴趣的目标进行定位,判断出目标的具体类别,并给出边框。
(3)目标跟踪。目标跟踪是指在特定场景下跟踪一个或多个对象的过程,与传统跟踪技术的监测和观察不同,现在的目标跟踪还被应用于无人驾驶领域。
(4)语义分割。计算机视觉可以将图像分成单独的像素组,然后对其进行标记和分类。特别地,语义分割试图在语义上理解图像中每个像素的角色。
(5)实例分割。区别于语义分割,实例分割将不同类型的示例继续分割,需要执行更加复杂的任务,确定不同对象之间的边界、差异及彼此之间的关系。
人类通过视觉感知外界的环境,机器也是如此,所以计算机视觉技术的发展对机器的智能化起着至关重要的作用。目前,计算机视觉已经在很多领域有着广泛的应用,例如,无人驾驶中的道路识别、路标识别、行人识别;人脸识别,无人安防;违章检测中的车辆车牌识别;智能识图;医学图像处理;工业产品检测等,都使我们的生产生活变得智能化、便捷化。
11.软计算
软计算通常包括人工神经网络计算、模糊计算和进化计算。一般来说,软计算多应用于缺乏足够的先验知识,只有一大堆相关的数据和记录的问题求解方面。
人工神经网络(Artificial Neural Network,ANN)是一种应用类似于大脑神经突触连接的结构进行信息处理的数学模型。在这一模型中,大量的节点之间相互连接构成网络,即“神经网络”,以达到处理信息的目的。人工神经网络模型及其学习算法曾经想利用数学来描述人工神经网络的动力学过程,从而建立相应的模型,然后在该模型的基础上,对于给定的学习样本,找出一种能以较快的速度和较高的精度调整神经元间互连权值,使系统达到稳定状态,满足学习要求的算法。
模糊计算处理的是模糊集合和逻辑连接符,旨在描述现实世界中类似人类处理的推理问题。模糊集合包含论域中的所有元素,而这些元素需要具有[0,1]区间的可变隶属度值。模糊集合最初由美国加利福尼亚大学教授扎德(L.A.Zadeh)在系统理论中提出,后来又扩充并应用于专家系统中的近似计算。
进化计算是通过模拟自然界中生物进化机制进行搜索的一种算法,遗传算法(Genetic Algorithm,GA)是进化计算的典型代表。遗传算法是一种随机算法,它是模拟生物进化中“优胜劣汰”自然法则的进化过程而设计的算法。该算法模仿生物染色体中基因的选择、交叉和变异的自然进化过程,通过个体结构不断重组,形成一代代的新群体,最终收敛于近似优化解。
12.智能控制
有科学家提出把人工智能技术引入智能控制领域,从而建立智能控制系统。1965年,美籍华人科学家傅京孙首先提出在学习控制系统中应用人工智能的启发式推理规则。十多年后,实用智能控制系统的技术日趋成熟,使人工智能与自动控制的结合成为可能。1977年,美国人萨里迪斯(G.N.Saridis)提出把人工智能、控制论和运筹学结合起来的思想。1986年,我国的蔡自兴教授提出把人工智能、控制论、信息论和运筹学四者相结合。根据这些思想已经研究出很多智能控制的理论和技术,并且可以据此构造用于不同领域的智能控制系统。
智能控制具有两个显著的特点。
(1)智能控制同时具有知识表示的非数学广义世界模型和传统数学模型混合表示的控制过程,并以知识进行推理,以启发来引导求解过程。
(2)智能控制的重点在于高层控制(组织级控制),组织实际环境或过程,对问题进行决策和规划,来求解广义问题。
13.智能规划
智能规划也是人工智能研究领域的一个分支,近年来不断发展,逐渐成为人们研究的重点。智能规划主要是认识和分析周围环境,依照自己的目标,根据若干选择方向和所提供的资源限制施行合理推理,最终制定出能够满足要求的规划。建立起效率高、实用性强的智能规划系统是智能规划研究的主要目标。该系统的主要功能是:给定问题的状态描述、对状态描述进行变换的一组操作、初始状态和目标状态。
GPS系统是最早的通用问题求解规划系统。1969年,格林(G.Green)利用归结定理证明的方法来进行规划求解,并且设计了QA3系统,这个系统被大多数的智能规划研究人员认为是第一个规划系统。1971年,美国斯坦福研究所的菲克斯(R.E.Fikes)和Nilsson设计的STRIPS系统在智能规划的研究中也具有里程碑式的意义和价值。他们的突出贡献是引入了STRIPS操作符的概念,使规划问题求解变得明朗清晰。此后到1977年先后出现了HACKER、WARPLAN、INTERPLAN、ABSTRIPS、NOAH、NONLIN等规划系统。尽管这些以NOAH系统为代表的部分排序规划技术被证明具有完备性,即能解决所有的经典规划问题,但由于大量实际规划问题并不遵从经典规划问题的假设,所以部分排序规划技术未得到广泛的应用。为消除规划理论和实际应用间存在的差距,20世纪80年代中期,更多的科学家将研究的目光转向了开拓非经典的实际规划问题。然而,经典规划技术,尤其是部分排序规划技术仍是开发规划新技术的基础。