译者序
翻译完《深度学习入门:基于Python的理论与实现》后不久,作者斋藤康毅又高产地出版了续作,专门讲解深度学习在自然语言处理中如何应用。翻到本书的前言,理查德·费曼所说的“凡我不能创造的,我就不能理解。”(“What I cannot create, I do not understand.”)这句话跃然纸上,而这句话在我为前作所写的译者序中也有提及。看来我和作者都比较认同这样一个观点:如果想真正弄清楚一件事情,就需要躬行实践。这或许也是一种缘分,所以我决定继续完成续作的翻译工作。
本书延续了前作的理念,但关注的应用领域不同:前作的内容以卷积神经网络和图像识别为主,而本书则侧重于循环神经网络和自然语言处理。本书详细介绍了单词向量、LSTM、seq2seq和Attention等自然语言处理中重要的深度学习技术。
当然,自然语言处理是一个综合性的研究领域,涉及语法、语义和语境等概念,有许多研究分支。除了深度学习这一研究范式之外,还有基于语言学、基于规则、基于机器学习的研究范式。本书涉及的单词含义、语言模型、文本生成只是其研究范围的一小部分。读者如果想更加全面地了解自然语言处理,还需要阅读更多相关资料。
前作出版后,很多读者在书评网站或者图灵社区反馈翻译得不错。不过,在翻译前作时,因为过于追求“信”,有时在语句的连贯性上稍有欠缺,个别地方读起来甚至有些别扭。为此,本书的翻译在保证原文含义不变的情况下,更多地使用了符合中文表达习惯的表述方式,以求读者在阅读本书时,会有更佳的阅读体验。
本书的翻译由本人独立完成,特别感谢图灵的编辑对全书的审校。最后,由于译者水平有限,书中难免存在一些错误与疏漏。欢迎各位读者批评指正,将发现的问题通过图灵社区反馈给我们,以便我们在本书重印时进行改正。
陆宇杰
2020年2月于上海