1.2.2 近代的智能世界:人工智能的基础
西方著名的哲学家罗素曾经说过:“近代世界与先前各世纪的区别,几乎每一点都能归源于科学。科学在17世纪获得了极其壮丽的成功。”[17]中外的古代先贤凭着自发的质朴的科学意识,着手研究数学计算与逻辑推理,开启了智能世界的探索之旅。在他们的不懈努力下,迎来了充满科学精神的近代智能世界,概率论和逻辑数学化进一步推动了智能世界的发展,这也是人工智能技术的基础。
1.概率论:可能性理论
概率论起源于赌博,最早出现于意大利。当时的意大利贵族沉迷于赌博游戏,意大利著名的数学家卡丹勒注意到,赌博中出现的无规则的随机现象看似无规律,实际上可能性(概率)大小基本是确定的。
扔骰子是一种简单的赌博方式。“骰子”俗称“色子”,中国传统民间娱乐用来投掷的博具,早在战国时期就有了。作为桌上游戏的小道具,最常见的骰子是六面骰,它是一个正立方体,上面分别有一到六个孔(或数字),其相对两面之数字的和必为七。中国的骰子习惯在一点和四点漆上红色。骰子是容易制作和取得的乱数产生器。随机掷出后,1、2、3、4、5、6点任意一面朝上的可能性是相同,即为1/6,也就是说任意一面朝上的概率是1/6。
概率是用来表示随机事件发生的可能性大小,概率与探求事物规律紧密相关。概率也称或然率、几率。与必然事件不同,随机事件是指在相同条件下,可能发生也可能不发生的事件,但大量事件的整体概率却呈现出必然的规律性,也就是说在不确定中存在确定性。
日常生活中充满了这样的概率现象:“这次比赛他估计能赢,也可能会输”“明天北京很有可能会刮风”“总有一天我会与自己喜欢的人一起去看日出”等,这些生活现象都包含了可能性(概率)大小的问题。
概率论[18]虽然起源于一种低级的赌博游戏,但它已经成为人类探索智能世界的重要工具。关于随机现象与可能性理论的概率论,帮助我们研究、解决那些具有不确定性、却又亟待解决的难题。
概率论作为严谨的数学分支,正式成形于17世纪中叶,由于赌博游戏的盛行,出身显赫却无聊至极的贵族子弟不断向数学家去请教如何确定赌局输赢的概率和进行赌博下注的问题。法国著名的数学家帕斯卡和费马(见图1-18)开始亲自做赌博实验,并进行了深度的理论研究,提出了概率论的崭新概念[19]。
图1-18 帕斯卡和费马
荷兰物理学家、数学家惠更斯(Christian Huygens)出版了他的著作《掷骰子游戏中的计算》,这本书被认为是关于概率论最早的论著,他创立了“惠更斯分析法”,第一次把概率论建立在公理、命题和问题上,并构成一个较完整的理论体系。惠更斯先从关于公平赌博值的一条公理出发,推导出有关数学期望的三个基本定理,利用这些定理和递推公式,解决了点子问题及其他一些博弈问题。惠更斯由此所得关于数学期望的3个命题具有重要意义,这是“数学期望”第一次被提出,后被拉普拉斯用数学期望来定义古典概率。
图1-19 拉普拉斯
继帕斯卡、费马和惠更斯之后,雅各布·伯努利对概率论研究作出了重要贡献。他的《猜度术》一书,包含了大数定律的叙述,不过,首先将概率论建立在扎实的数学基础上的是拉普拉斯[20](见图1-19)。从1771年起,拉普拉斯发表了一系列重要著述,特别是1812年出版的《概率的解析理论》,对古典概率论作出了强有力的数学综合,叙述并证明了许多重要定理。拉普拉斯等人的著作还讨论了概率论在人口统计、保险事业、度量衡、天文学甚至某些法律问题上的应用。到18世纪概率论已不再是仅仅与赌博问题相联系的学科了,数学家开始了更广阔的应用研究。
接下来,仍以掷骰子为例,说说概率论的几个基本概念。
随机事件:随机实验中可能发生也可能不发生的事件,常用大写字母A、B、C等表示。例如,事件A,“点数1”;事件B,“点数2”等。
必然事件:随机实验中必然发生的事件,例如“点数小于6”。
基本事件:在一定范围内不能再分解的事件。例如,“点数2”是一个不能再分解的事件。
互不相容事件:一次实验中不可能同时发生的事件。例如,“点数1”与“点数2”不能同时出现。
复杂事件:由基本事件(复合)组成的事件。例如,“奇数点”是由投掷1、投掷3、投掷5等三个事件组成。
样本点:随机实验中每一个可能的结果(事件),是样本空间中的一个点。
样本空间:全体样本点组成的集合。例如,投骰子可能出现的结果有6种,被称为结果集{1,2,3,4,5,6}。
频率:如果进行了m次随机实验,事件A出现了n次,则用比值n/m表示事件A在m次随机实验中出现的频率。
概率:随着实验次数m的增加,事件A发生的频率会逐渐稳定在区间[0,1]中的某个常数上,这个常数就是事件A发生的概率,记作p(A)。
条件概率:在事件B已经发生的条件下,事件A发生的概率,记作p(A│B)。
大数定理:当实验次数足够大时,事件出现的频率将稳定在一个定数附近。
詹姆斯·伯努利(James Bernoulli)提出了主观“置信度”概念,替代客观的频率概念。在此基础上,贝叶斯(Thomas Bayes)提出了一种更新主观概率的规则——贝叶斯规则的分析理论奠定了人工智能系统中关于不确定性推理的现代方法论基础。
2.布尔:逻辑数学化
图1-20 乔治·布尔
爱尔兰数学教授乔治·布尔[21](George Boole)(见图1-20)被称为数理逻辑第一人,他使逻辑学从哲学变成了数学。他认为,逻辑中最基本的东西“类”由属于它的“元素”组成,他们都可以用符号表示。逻辑可以看作类的演算,即相应符号的代数。
1847年,他出版了著作《逻辑的数学分析》,提出了逻辑代数。1954年,他又发表了《思想规律的研究》,提出了以下重要概念:符号语言与运算可以用来表示任何事物。
布尔运算[22]是数字符号化的逻辑推演法,包括联合、相交、相减。在图形处理操作中引用了这种逻辑运算方法后,通过简单的基本图形组合产生新的形体。布尔用数学方法研究逻辑问题,成功地建立了逻辑演算。他用等式表示判断,把推理看作等式的变换。这种变换的有效性不依赖于人们对符号的解释,只依赖于符号的组合规律。人们把这一逻辑理论称为布尔代数。
符号表示方法如下:
∨表示“或”;
∧表示“与”;
┐表示“非”;
=表示“等价”;
1和0表示“真”和“假”。
(还有一种表示,即+表示“或”,·表示“与”。)
布尔代数的主要运算法则有结合律、交换律、分配律、吸收律、幂等律等。
(1)结合律:(a+b)+c=a+(b+c),(a·b)·c=a·(b·c)。
(2)交换律:a+b=b+a,a·b=b·a。
(3)分配律:a·(b+c)=(a·b)+(a·c),(a+b)·c=(a·c)+(b·c)。
(4)吸收律:a+a·b=a,a·(a+b)=a。
(5)幂等律:a+a=a,a·a=a。
a、b、c被称作“逻辑变量”或“布尔变量”,它们都是二值变量,取值为1或0。a+b叫作“逻辑加”“逻辑或”运算;ab叫作“逻辑乘”“逻辑与”运算。这两种运算与代数的加法和乘法类似。
20世纪30年代,逻辑代数在电路系统上获得应用,随着电子技术与计算机的发展,出现了各种复杂的大系统,但它们的变换规律依然遵守布尔所揭示的规律。早期的电器开关有铡刀开关、继电器开关,后来有了电子管、晶体管、集成电路实现的电子开关。如果把“断开”叫0状态,那么“连接”叫1状态。
1938年,克劳德·香农将布尔代数应用到继电器开关电路的设计,因此又称为开关代数。随着数字电路的发展,布尔代数已成为数字逻辑电路分析和设计的数学基础,又称逻辑代数,在二值逻辑电路中广泛应用。