前言
深度学习(Deep Learning)是人工智能领域的一个概念,和传统的学习相比,深度学习强调学习的深度,揭示内部规律。深度学习是机器学习领域中一个新的研究方向,它被引入机器学习使其更接近最初的目标——人工智能。深度学习是学习样本数据的内在规律和表示层次,这些学习过程中获得的信息对诸如文字、图像和声音等数据的解释有很大的帮助。它的最终目标是让机器能够像人一样具有分析学习能力,能够识别文字、图像和声音等数据。深度学习是一个复杂的机器学习算法,在语音和图像识别方面取得的效果远远超过先前的相关技术。
深度学习是一个多层神经网络,是一种机器学习方法。在深度学习出现之前,由于诸如局部最优解和梯度消失之类的技术问题,没有对具有4层或更多层的深度神经网络进行充分的训练,并且其性能也不佳。但是,近年来,Hinton等人通过研究多层神经网络,增强学习所需的计算机功能,以及通过Web的开发促进培训数据的采购,使充分学习成为可能。结果,深度学习显示出了高性能,压倒了其他方法,解决了与语音、图像和自然语言有关的问题,并在2010年开始流行。
作为人工智能最重要的基础技术之一,近年来深度学习逐步延伸到更多的应用场景,如自动驾驶、互联网、安防、医疗等领域。随着深度学习模型越来越大,所需的数据量越来越多,所需的AI算力资源和训练时间越来越长,深度学习的训练和推理性能将是重中之重。
传统机器学习算法依赖人工设计特征,并进行特征提取,而深度学习方法不需要人工,而是依赖算法自动提取特征。深度学习模仿人类大脑的运行方式,从经验中学习获取知识。这也是深度学习被看作黑盒子,可解释性差的原因。随着计算机软硬件的飞速发展,现阶段通过深度学习模拟人脑来解释数据,包括图像、文本和音频等内容。目前深度学习的主要应用领域有智能手机、语音识别、机器翻译、拍照翻译、自动驾驶等,在其他领域也能见到深度学习的身影,比如风控、安防、智能零售、医疗领域和推荐系统等。
读者需要了解的重要信息
本书作为机器学习与深度学习专业书籍,介绍机器学习的基础知识、深度学习的理论基础和算法,以及常见应用场景及其Python实现。案例实践的讲解包含:算法分析、项目应用目的与效果、模型构建、数据准备与预处理、模型训练和预测,以及代码实现、问题分析和实验对比。所有示例均配有源代码与数据。
本书采用理论与实践相结合的方式,利用Python语言的强大功能,以最小的编程代价进行深度学习应用实践。本书展示如何将深度学习的算法应用于场景实践,如计算机视觉、目标检测、文本分析以及深度强化学习应用,最后还给出了深度学习的两个框架模型应用:TensorFlow和Transformer模型应用。为了帮助读者理解深度学习算法涉及的数学知识,本书还在附录中给出了机器学习和深度学习中用到的数学基础知识,如线性代数、概率论和信息论。
本书内容
本书基于Python 3全程以真实案例驱动,科学系统地介绍机器学习与深度学习领域的科学思维、必备知识、专业工具、完整流程以及经验技巧。
本书整体分11章主体内容和3章附录,系统地讲解了深度学习基础知识与领域应用实践。第1章简要介绍了深度学习与机器学习的关系和深度学习应用场景,第2章是机器学习基础,第3章是神经网络基础,第4章是卷积神经网络和循环神经网络,第5章是正则化与深度学习优化,第6章是计算机视觉应用,第7章是目标检测应用,第8章是文本分析应用,第9章是深度强化学习应用,第10章是TensorFlow框架应用,第11章是Transformer框架应用,附录A是线性代数,附录B是概率论,附录C是信息论。本书的例子都是在Python 3集成开发环境Anaconda 3中经过实际调试通过的典型案例,书中的大部分实验数据来源于GitHub,读者可以参考实现。
示例源码、PPT课件资源下载
本书配套70个示例源码、PPT课件,需要用微信扫描下面的二维码获取。如果发现问题或者有任何建议,可通过邮件与作者联系,电子邮箱为booksaga@163.com,邮件主题写“Python深度学习原理、算法与案例”。
致谢
本书完成之际,感谢李剑锋、林庆发和邓淇文等作者的努力付出。也要感谢同事,与他们的交流与探讨使得本书得以修正错误和完善知识结构。由于作者水平有限,书中的纰漏之处在所难免,恳请读者不吝赐教。本书编写过程中参考的资源都已在参考文献中列出,所有案例都提供了源代码。
编者
2023年1月