深度学习与MindSpore实践
上QQ阅读APP看书,第一时间看更新

1.3 深度学习的现实应用

近年来掀起的深度学习革命已经深刻地改变了诸多应用领域,并将在越来越多的领域取得成功。其中最广为人知的领域包括自动语音识别、图像识别、自然语言理解及很多其他交叉领域(如医疗、生物、金融等)。下面将依次简单介绍这些深度学习的典型现实应用。

1.3.1 自动语音识别

自动语音识别(Automatic Speech Recognition,ASR)是一项将语音转换成文本的技术。从早期的基于模板的方法到严格的统计模型,再到如今的深度模型,语音识别技术已经经历了几代的更迭。在深度学习模型之前,自动语音识别的主流模型是隐马尔可夫模型(Hidden Markov Models,HMM)。在使用这些模型之前,所有的自动语音识别系统都需要经历四个步骤:特征提取、声学模型、语言模型和解码搜索。在进入声学模型之前,需要消除噪声和增强信号,并将信号从时域转换到频域。声学模型主要用来进行特征的转换与表示,再通过一个语言模型,在解码搜索中对模型的结果进行排序并选取得分最高的文本序列。早期应用于声学建模的深度模型是普通的深度神经网络(Deep Neural Networks,DNN),但DNN需要固定大小的输入,因而需要一种能够处理不同长度语音信号的方法。另外,考虑到语音信号是一种非平稳时序信号,如何有效地对长时时序动态相关性进行建模也颇为重要。而这些恰好是循环神经网络的强项。因此,目前主流的自动语音识别深度学习模型是循环神经网络的变种——长短期记忆网络(Long Short Term Memory,LSTM)。以循环神经网络为基础的语音识别系统极大地减少了识别错误率,被广泛应用于目前商业上主流的语音识别设备(如亚马逊的Alexa)上。

1.3.2 图像识别

图像识别是深度学习最成功的应用之一。深度学习在计算机视觉领域的突破发生在2012年,Hinton教授的研究小组利用卷积神经网络架构(AlexNet)大幅降低了ImageNet ILSVRC挑战中图像分类任务的错误率并取得了冠军。之后不断有新的基于卷积神经网络的架构被提出,包括GoogleNet、VGGNet、ResNet、DenseNets和Inception。这些模型在不断加深网络深度的同时,也能不断提升图像分类的准确率。同时,深度学习也被应用于其他计算机视觉任务中,包括目标检测、图像分割、图像标注、行为分析、人脸识别,以及基于生成对抗网络(Generative Adversarial Networks,GAN)的图形风格迁移、视频生成等。在这些应用的背后,起到关键作用的深度学习模型当属深度卷积神经网络。卷积神经网络中最重要的操作是卷积和池化。受益于参数共享和稀疏连接,卷积神经网络非常适合处理图像数据。通过堆叠很多层,卷积神经网络可以不断地从低层特征中提取更高层的特征,最终更好地进行下游任务的处理。目前各种新的网络架构仍在不断被提出,我们期望深度学习在图像识别领域不断取得新的成果。

1.3.3 自然语言处理

神经网络从2000年开始就逐渐被应用到语言模型中,在成分解析、情感分析、信息抽取、机器翻译、文本分类等自然语言理解的任务上均取得了好的结果。其中,一项重要成果就是词向量的学习。词向量可以看作是一种运用深度神经网络将词转换成隐含空间中的一个向量化的位置表示的方法。将词向量作为循环神经网络的输入,能有效利用合成式的向量语法对句子和短语进行解析。合成式的向量语法可以被认为是由循环神经网络实施的上下文无关的概率语法。另一方面,以长短期记忆网络为代表的循环神经网络在机器翻译和语言模型等方面的表现也较为突出。近年来,除了循环神经网络之外,新的一些深度神经网络结构(如Transformer)也不断被提出,它们通过学习文本序列中的长期依赖和分层结构,在自然语言处理的任务上取得了显著的效果。此外,基于预训练的无监督模型,如建立在Transformer基础上的BERT(Bidirectional Encoder Representations from Transformers)模型,采用迁移学习和微调的方法,进一步刷新了深度学习方法在自然语言处理任务上的技术前沿。到目前为止,面向自然语言处理任务的深度学习架构仍在不断进化,与强化学习、无监督学习等的结合应该会带来效果更优的模型。

1.3.4 其他领域

深度学习在其他领域(如生物学、医疗和金融等)也有很多应用。在生物学研究中,深度学习算法可以发现人类无法捕捉到的特征。研究人员利用这些算法对细胞图像进行分类,建立基因组连接,加速药物发明周期。在医疗领域,深度卷积神经网络被应用于癌细胞分类、病变检测、器官分割和图像增强等医疗图像分析任务中,并取得了不错的成果。在金融领域,深度学习被应用于金融欺诈检测和反洗钱等任务,也可以通过模拟交易员的行为,完成选股、择时、风控等较为复杂的任务。此外,深度学习在异常检测和信用评分等领域也有应用。