Python深度学习原理、算法与案例
上QQ阅读APP看书,第一时间看更新

1.4 深度学习的应用场景

深度学习是机器学习的一个分支,它除了可以学习特征和任务之间的关联以外,还能自动从简单特征中提取更加复杂的特征,以完成对目标函数的拟合任务。随着神经网络的盛行,深度学习被应用到很多领域。本节主要根据深度学习的技术类别和深度学习的应用场景两个方面进行说明。

1.4.1 技术类型

根据网络模型参数的确定方法,深度学习技术可以分为监督深度学习技术、无监督深度学习技术和增强深度学习技术3类。其中监督深度学习技术中的网络模型参数是利用带标注的训练数据对网络进行训练而得到的,无监督深度学习技术中的网络模型参数的确定则无须带标注的训练数据,增强深度学习技术中的网络模型参数是利用特定评分策略对网络输出进行评分后确定的。

1.监督深度学习技术

监督深度学习技术主要包括多层感知器、卷积神经网络和循环神经网络等。多层感知器技术是早期神经网络研究的基础性成果,也是衡量深度神经网络性能的对比参照基础。卷积神经网络包括分类网络、检测网络、分割网络、跟踪网络和轻量化网络。循环神经网络主要包括长短期记忆(Long Short-Term Memory,LSTM)网络和门控循环单元(Gated Recurrent Unit,GRU)网络。

一般情况下,卷积神经网络均属于前馈神经网络,信息按神经元在网络中的层次由浅至深地进行处理,而层次较浅的神经元参数不会受到层次较深的神经元输出的控制,即网络没有记忆,因此通常不适用于序列学习。循环神经网络引入了深层神经元输出到浅层神经元输入和状态的控制机制,使网络具有记忆功能,更适用于序列学习。由于绝大部分经典自然语言处理任务均属于序列学习的范畴,因此循环神经网络在自然语言处理领域取得了广泛的应用。

2.无监督深度学习技术

无监督深度学习技术主要包括玻尔兹曼机、自编码器和生成对抗网络等。虽然可以使用监督学习的方式训练网络,但受限于玻尔兹曼机,通常被视为一种早期经典的无监督深度学习技术。自编码器能够通过无监督学习,生成输入数据低维表示,可用于数据的去噪、降维和特征表示等任务。自编码器一般均采用编码器-译码器结构实现自监督学习,主要包括VAE、Stacked Denoising AE和Transforming AE等技术。生成对抗网络是近年来无监督深度学习技术的研究热点之一,主要包括GAN、CGAN、WGAN、EBGAN、infoGAN、BigGAN和SimGAN等。生成对抗网络的主要思想是利用生成模型和分辨模型之间的竞争关系,在网络损失度量中包含利于一个模型而不利于另一模型的部分,训练过程使生成模型输出将输入噪声信号尽可能逼近信息输入,而同时提高分辨模型分类与生成模型信息输出与输入的正确性,从而达到网络整体性能的优化。

3.增强深度学习技术

增强深度学习技术主要包括Q学习和策略梯度学习。Q学习的核心思想是利用深度神经网络逼近贝尔曼方程描述的递归约束关系。Q学习算法一般采用估计、决策和更新的迭代过程,经典的估计方法有蒙特卡洛树搜索算法、动态规划算法等,基本的Q学习方法有DQN、Double DQN、Prioritized DQN和DRQN等。策略梯度学习的基本方法是利用深度神经网络实现策略的参数化,并通过梯度优化控制参数权重,选择较好的行为实现策略,常用的策略梯度有有限差分策略梯度、蒙特卡洛策略梯度、Actor-Critic策略梯度等,主要的策略梯度学习方法有REINFORCE、TRPO、DGP、DDGP等。

1.4.2 应用场景

随着算力的不断发展和数据的多样性,深度学习在安防、教育、零售、自动驾驶等诸多领域落地。

1.图像分类

图像分类任务是模型根据输入的图像进行预估。比如Esteva等基于Inception v3主干网络,直接使用多达13万份带标注的临床影像数据来训练,训练任务是检验该深度神经网络对于皮肤癌分类预估的性能。

例如,深度学习在医学图像分类中的应用。

2.自然语言处理

自然语言处理(NLP)是一种解释和处理人类语音的算法,属于语言学、计算机科学和人工智能领域。自然语言处理中使用了各种算法来分析数据,从而使系统能够产生人类语言或识别人类语音中的音调变化。

3.自动驾驶汽车

驾驶的目的是对外部因素做出安全反应,例如周围的汽车、路牌和行人,以便从一个点到达另一个点。尽管我们距离全自动驾驶汽车还有一段距离,但深度学习对于让这项技术达到今天的水平至关重要。

4.图像识别

图像识别,是指利用计算机对图像进行处理、分析和理解,以识别各种不同模式的目标和对象的技术,是应用深度学习算法的一种实践应用。现阶段,图像识别技术一般分为人脸识别与商品识别,人脸识别主要运用在安全检查、身份核验与移动支付中;商品识别主要运用在商品流通过程中,特别是无人货架、智能零售柜等无人零售领域。

5.聊天机器人

聊天机器人是通过文本或音频消息模仿人类对话的计算机软件程序。当我们使用在线平台时,聊天机器人非常普遍,如今的人工智能系统能够理解用户的需求和偏好,并推荐在很少或几乎没有人类干预的情况下执行哪些操作。目前市场上有许多流行的会话助手,包括苹果开发的Siri、微软开发的Cortana、亚马逊和谷歌助手开发的Alexa。随着聊天机器人的出现,所有平台现在都可以为其访问者提供定制的体验。聊天机器人使用机器学习算法和深度学习算法来生成回复的组合。经过大量数据的训练,聊天机器人可以理解客户的要求,以及他们面临的困难,并以非常简单的方式指导和帮助客户解决他们的问题。

6.虚拟助手

亚马逊开发的Alexa、Apple开发的Siri和Google Assistant等虚拟助手是深度学习的流行应用程序。这些用于许多家庭和办公室,以简化日常任务。使用这些助手的人数正在增加,并且这些助手变得越来越聪明,并且在用户与他们互动时越来越多地了解用户及其偏好。虚拟助手使用深度学习来了解我们的兴趣,例如我们最喜欢的聚会场所或我们最喜欢的电视节目。为了理解我们所说的,虚拟助手考虑了人类的语言。虚拟助手还可以将我们的声音翻译成文本格式,为我们安排会议等。此外,虚拟助手在很多地方都得到了应用,并且还被集成到各种设备中,包括物联网和汽车。由于互联网和智能设备,这些虚拟助手将继续变得越来越智能。

7.地震预报

由于地震预报的破坏性后果,科学家正在努力解决地震预报问题。成功的地震预报可以挽救无数生命。科学家们正试图根据地震发生的时间和地点以及震级来预测地震。深度学习模型能够从原始数据中提取元素再学习,以识别自然事物并对广泛的学科领域做出正确的决策。此外,由于计算能力的改进,大型模型的训练变得更加容易。由于深度学习的算法优势,使得地震预报成为可能。

8.欺诈检测和新闻聚合

如今的货币交易正在走向数字化,在深度学习的帮助下正在开发许多应用程序,这些应用程序可以帮助检测欺诈行为,从而帮助金融机构节省大量资金。此外,现在可以过滤新闻提要以删除所有不需要的新闻,并且读者可以阅读基于他们感兴趣的领域的新闻。

9.机器人

深度学习在计算机视觉领域的良好成果推动了一些机器人技术的应用,深度学习在机器人技术中被大量用于执行类似人类的任务。机器人的构建是为了了解它们周围的世界,对它们来说弄清楚是什么是非常重要的。