深度学习与深度合成
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

1.1 人工智能与深度学习

1.1.1 人工智能的诞生

制造能够模拟人或者动物的智能机器,从古至今一直是人类不断追求的梦想。在浩如烟海的民间故事和史料记载中,一些令人难以置信的智能机器可能仍然超乎现代人的想象。《列子·汤问》记载名叫偃师的能工巧匠为周穆王制造了一个能唱歌跳舞的机器人,行走俯仰,和真人一样。《三国志·诸葛亮传》等多部史书中记载,蜀国丞相诸葛亮为了方便北伐运输粮草,发明了既节省人力、财力,又可预防被抢的“木牛流马”,解决了十万大军的粮草运输问题。在印度的古代传说中,佛陀珍贵的遗物是由受机器人武士所保护的,这些像风一样旋转的机器人武士可以用剑砍杀入侵者。

当然,这些故事或传说更应该看作人类几千年来一直追逐但难以实现的梦想。直到第一次工业革命时期到来(18世纪60年代~19世纪中期),伴随着蒸汽机和自动织布机的出现,机器才开始真正逐步代替了人类的手工劳动。而且随着机械制造技术和电力技术的发展,机器不仅能够代替人类完成体力劳动,而且能够表现出一定的智能性,帮助人类完成一些智力工作。在电子计算机出现之前,就涌现了一批具有智能性的机器,如手摇计算机等手段来帮助人类进行数字计算。1946年2月14日,世界上第一台通用电子计算机“ENIAC”在美国宾夕法尼亚大学诞生(图1-1),尽管其每秒钟仅能进行在现在看来微不足道的5000次加法运算,但计算机所具有的运算、存储和输入输出能力无疑为模拟人类智能提供了重要的物质基础和实现平台。

第一台电子计算机的产生并不是孤立的,很大程度上离不开提出奠基性研究成果的众多科学家,其中最著名的当属英国数学家、逻辑学家艾伦·麦席森·图灵(Alan Mathison Turing)。1936年,图灵在其题为《论数字计算在决断难题中的应用》论文里描述了一种可以辅助数学研究的机器——图灵机。第一次在纯数学的符号逻辑和实体世界之间建立了联系,是存储程序式计算机发展道路上最重要的理论突破。图灵在第二次世界大战中从事密码破译工作,涉及电子计算机的设计和研制,并成功破解了德军著名的U2潜艇恩格玛密码系统,为第二次世界大战盟军扭转太平洋战区的战局立下了汗马功劳。此外,图灵一直关注如何让计算机执行更多智能性的工作,如他主张智能机器应该像孩子一样学习成长;他认为可以通过模仿动物进化的方式获得智能。1950年,图灵提出了著名的图灵测试并作为测试标准一直沿用至今。在这一测试中,图灵设想将一台计算机与一个人分隔开,通过打字进行交流,如果计算机能够以一定概率(大于30%)让测试人员误认为它是人,则说明计算机具有智能性。因此,图灵被称为计算机科学之父、人工智能之父(图1-2)。正因如此,1966年美国计算机协会ACM专门设立了计算机科学领域的最高奖——图灵奖。

图1-1 第一台电子计算机ENIAC

图1-2 图灵和他的图灵测试示意图

在图灵开始他的人工智能研究不久,当时的一些年轻学者也开始关注这一崭新的领域,其中包括美国达特茅斯学院助理教授约翰·麦卡锡(John McCarthy)、哈佛大学数学与神经学初级研究员马文·明斯基(Marvin Minsky)、贝尔实验室数学家克劳德·香农(Claude Shannon)、IBM信息研究经理纳撒尼尔罗切斯特(Na-thaniel Rochester)。1956年8月,这些学者召集艾伦·纽厄尔(Allen Newell)、赫伯特·西蒙(Herbert Simon)等10余人齐聚美国汉诺斯小镇达特茅斯学院,研讨“如何用机器模拟人的智能”。这次会议也被称为“达特茅斯会议”。正是在这次会议上,研究人员提出了“人工智能”这一概念。达特茅斯会议被公认为人工智能研究的开始,1956年也因此成为人工智能元年。当时人工智能的研究非常宽泛,像编程语言、计算机复杂度等如今看起来并不算人工智能范畴的内容也需要人工智能学者们进行研究,主要是当时计算机刚刚诞生不久,人工智能研究人员必须从基础研究开始着手。尽管如此,达特茅斯会议也确定了现代人工智能领域的主要研究内容。

经过六十多年的发展,人工智能从最初的逻辑推理、启发式算法、单神经元,到专家系统、感知器,再到如今的云计算、大数据、深度学习,人工智能已经和计算机、互联网等传统IT技术一样,与我们的日常生活密不可分,并极大地改变了社会生产方式、人们的生活方式以及人对社会的认知方式。尤其是近10年来人工智能技术在社会各个领域的成功应用,让人类对未来人工智能技术的发展不再持质疑态度,而是充满了肯定和期待(图1-3)。

图1-3 达特茅斯会议学者在2006年的合影

左起:摩尔、麦卡锡、明斯基、塞弗里奇、所罗门诺夫

1.1.2 什么是深度学习

在最近的几年中,计算机视觉、语音识别、自然语言处理和机器人领域所取得的突破性进展都离不开深度学习。那么到底什么是深度学习呢(图1-4)?

图1-4 人工智能、机器学习、人工神经网络和深度学习之间的关系

人工智能是涵盖内容最广的一个概念,包括知识表示、问题搜索、逻辑推理等,机器学习(Machine Learning)则是人工智能的一个重要分支,主要研究如何让计算机具有能够自我学习的能力。机器学习在20世起八九十年代逐渐发展起来,它致力于研究如何通过计算的手段,利用学习经验来改善计算机系统自身的智能性。通过从经验中获取知识,机器学习算法摒弃了人为向机器输入知识的操作,转而凭借算法自身学习到所需知识。机器学习算法有上千种之多,除人工神经网络外,还包括决策树算法(Decision Tree)、支持向量机(Support Vector Machine, SVM)、遗传算法(Genetic Algorithm)等。

深度学习是一种利用深度人工神经网络来进行自动分类、预测和学习的技术,可以看作一种新型的机器学习技术。近些年来,深度学习技术日益盛行起来,逐渐呈现出取代其他机器学习算法的趋势,这主要是因为随着机器学习任务越来越复杂和多变,人们逐渐发现针对具体任务生成特定特征不仅费时费力,同时还特别敏感,很难将其应用于另一任务。此外,对于一些任务,人们根本不知道该如何使用特征。与此相反,深度学习完全将这个步骤自动化:利用深度学习,你可以一次性学习所有特征,而无须自己手动设计提取特征。这极大地简化了机器学习工作流程,能够将包含特征学习、特征抽象等复杂的多阶段流程替换为一个简单的、端到端的深度学习模型。

与一般的机器学习技术相比,深度学习另外具备的一大特色是可以处理各种非结构化数据,特指图像、视频、文本、音频等,而一般的机器学习更适合处理结构化数据,即可以使用关系型数据库进行存储、管理和访问的数据。

总而言之,机器学习是人工智能的一种实现方法,深度学习同样也是一种实现机器学习的方法,是在机器学习和人工神经网络的基础上发展起来的。深度学习最基本的形式是深度神经网络,直接脱胎于机器学习中的人工神经网络算法。