人工智能辅助药物设计
上QQ阅读APP看书,第一时间看更新

第1章 绪论

1.1 人工智能发展历史

“人工智能”作为一个研究领域的名称,在1956年达特茅斯会议(Dartmouth Conferences)上首次提出。以John McCarthy(LISP语言发明者、图灵奖得主)、Marvin Minsky(人工智能与认知学专家)、Claude Shannon(信息论的创始人)和Allen Newell(计算机科学家)等为首的科学家共同研究和探讨用机器模拟智能的有关问题,首次提出了“人工智能”,它标志着“人工智能”这门新兴学科的正式诞生。但是,“制造出能像人一样思考和行动的机器”这一梦想则可以追溯到古希腊,例如,古希腊哲学家亚里士多德(公元前384—公元前322)给出了形式逻辑的基本规律。但将人工智能具体实践并发展,还是在电子计算机产生以后。1936年,Turing提出的图灵机模型通过读入、写出、向左和向右移动读写头等基本操作就可以模拟任何机械的形式化算法,奠定了现代电子计算机理论模型的基础。1946年,全球第一台通用计算机ENIAC诞生。它最初是为美军作战研制,每秒能完成5000次加法、400次乘法等运算。ENIAC为人工智能的研究提供了物质基础。1950年,Alan Turing提出了著名的“图灵测试”,用来衡量一个机器是否具有智能。如果计算机能在5分钟内回答由人类测试者提出的一系列问题,且其超过30%的回答让测试者误认为是人类所答,则通过测试。关于人工智能的奇思妙想,研究人员也在不遗余力地研究。在此后的几十年间,人工智能先是被捧为人类光明未来的钥匙,后又被当作过于自大的异想天开而抛弃。

20世纪50年代到60年代,人工智能迎来了第一个黄金时代。1956年,达特茅斯会议确定了人工智能的名称和任务,同时出现了最初的成就和最早的一批研究者,这一事件也被视为人工智能诞生的标志。1959年,计算机游戏先驱Arthur Samuel在IBM的首台商用计算机IBM 701上编写了西洋跳棋程序,这个程序顺利战胜了当时的西洋棋大师罗伯特·尼赖。1965年,专家系统首次亮相。美国科学家Edward Albert Feigenbaum等研制出化学分析专家系统程序DENDRAL,用于分析实验数据来判断未知化合物的分子结构。

20世纪70年代初,人工智能遭遇发展瓶颈。即使是最杰出的人工智能程序,也只能解决它们尝试解决的问题中最简单的那部分,也就是说,彼时的人工智能程序都只是“玩具”。人工智能研究者们遭遇了无法克服的基础性障碍。尽管某些局限后来得以成功突破,但是许多难题至今未得到圆满解决。

20世纪80年代,人工智能迎来了第二个黄金时代。1982年,物理学家John Hopfield证实一种新型的神经网络(现称为“Hopfield网络”)能够用一种全新的方式学习和处理信息。大约在同一时间,Geoffrey Hinton和David Rumelhart提出了一种训练神经网络的方法——反向传播算法。这些发现使1970年以来一直“遭人遗弃”的联结主义重获新生。

20世纪90年代中期,人工智能终于实现了其最初的一些目标,并开始成功应用在整个技术行业中。在人工智能领域内部,一些子领域开始形成,分别专注于特定的问题和方法,如机器学习、自然语言理解、计算机视觉、机器人学等。1997年,IBM公司研发的超级计算机DeepBlue(深蓝)战胜了国际象棋世界冠军Garry Kasparov,成为人工智能发展中的一个重要里程碑。深蓝的运算速度为每秒2亿步棋,并存有70万份大师对战的棋局数据,可搜寻并估计随后的12步棋!

在过去几年中,人工智能呈现爆炸式发展态势,这多半要归因于图形处理器(GPU)的广泛应用——使并行处理变得更快、更便宜、更强大,以及几乎无限的存储空间和海量数据的出现,特别是“大数据运动”后出现的数据,例如图像、文本、交易数据、地图数据等。

随着互联网的发展和计算机的普及,数据的激增为人工智能的应用奠定了基础。同时,计算机硬件技术的飞速发展,GPU、TPU和分布式计算的出现,为人工智能算法提供了强大的算力支撑。2016—2017年,AlphaGo战胜围棋冠军。AlphaGo是由谷歌的DeepMind团队开发的人工智能围棋程序,具有自我学习能力,能够搜集大量围棋对弈数据和名人棋谱,学习并模仿人类下棋。后来出现的AlphaGo Zero(第四代AlphaGo)在无任何数据输入的情况下,开始自学围棋,在诞生36小时后便以100∶0的成绩超越了第二代AlphaGo(AlphaGo Lee),又在诞生的第40天战胜了在人类高手看来不可企及的第三代AlphaGo(AlphaGo Master)。

如图1-1所示,人工智能、机器学习和深度学习三者是依次包含的关系。机器学习是人工智能的一个子领域,而深度学习是一种机器学习方法。机器学习是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科知识。机器学习专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。它是人工智能核心,是使计算机具有智能的根本途径。

图1-1 人工智能、机器学习和深度学习关系图

深度学习是机器学习的一种,而机器学习是实现人工智能的必经路径。深度学习的概念源于人工神经网络,例如,含多个隐藏层的多层感知器就是一种深度学习结构。深度学习通过组合低层特征形成更抽象的高层表示属性类别或特征,以发现数据的分布式特征表示。研究深度学习的动机是建立模拟人脑进行分析学习的神经网络,通过模仿人脑的机制来解释数据,例如图像、声音和文本等。

近年来,人工智能的火热源于大数据和更快、更强的计算机硬件的发展,以深度神经网络模型为代表的深度学习方法引领了第三次人工智能浪潮的兴起。