商用机器学习:数据科学实践
上QQ阅读APP看书,第一时间看更新

1.1 关于本书及相关材料

本书旨在为读者带来有用的知识,并帮助他们有效地与数据科学家合作。本书涉及的机器学习知识并不高深,不会把读者转变成一个数据科学家,但我们希望本书能激励一些读者在这方面继续深造,增强自己的技能。数据科学很可能会被证明是21世纪最具价值、最令人激动的专业。

为了更有效地使用机器学习技术,我们必须要了解其底层算法。很多人在学习机器学习技术时,往往会使用机器学习的编程语言及大量相关的语言包,却不知道这些语言包的具体含义,甚至无法准确解读其结果,这就好比一位金融从业者使用布莱克–斯科尔斯模型(Black-Scholes Model)为期权进行估值,却不了解布莱克–斯科尔斯模型的来历,也不知道它的使用局限性。

在本书中,我们将向各位介绍机器学习背后的算法逻辑,从而帮助读者系统准确地理解最终结果。很多研究机器学习的学者都希望掌握一门像Python这样的编程语言,业界也依据Python开发了许多软件包。由此在本书中我们将采用一种新的学习方式,即同时使用Excel和Python进行学习,因为对于很多初学者来说,Excel较Python更易于上手。

读者可以在以下链接中下载关于本书的学习资料:www-2.rotman.utoronto.ca/~hull),也可以从Excel开始入手,按照自己的节奏,最后慢慢转向Python,并依据各种机器学习的语言包,来快速处理海量数据,而这些功能在Excel中则难以实现。