上QQ阅读APP看书,第一时间看更新
译者序
计算机视觉是一门研究如何使机器“看”的科学。它涉及如何使计算机从数字图像或视频中获得高层次的理解,并寻求自动化人类视觉系统可以完成的任务。深度学习是机器学习研究中的一个新领域,它通过多层神经网络模仿人脑的机制来分析和解释数据。深度学习不仅推动了计算机视觉领域的发展,其自身也在解决计算机视觉问题的过程中不断进步。结合深度学习,计算机视觉的许多新应用应运而生,并且正在成为我们日常生活的一部分,包括人脸识别、自动驾驶汽车中的机器视觉等。
本书系统概述了基于深度学习的计算机视觉的相关理论和技术现状,涵盖了计算机视觉深度学习的主要问题,包括图像分类、图像检索、目标检测、语义分割、相似性学习、图像题注、生成模型、视频分类、平台部署。本书针对每个问题介绍了常见的应用场景、数据集、主要技术和TensorFlow框架下的编程实例。通过阅读本书和代码实践,读者可以比较全面地了解基于深度学习的计算机视觉的基础知识和领先技术。
本书的译文力求忠实准确地表达原文。相关术语的翻译参考了业内的一般用语。由于计算机视觉深度学习领域的发展日新月异,新技术和新术语也层出不穷。对新术语或读者可能较陌生的术语,译文中给出了相应的英文术语对照。另外,书中诸如“当前最好的技术”等说法,会随着新技术的出现而发生变化。读者应持续关注最新的研究进展。
本书翻译过程中,图灵公司的杨琳编辑审阅了全部书稿,提出了许多宝贵意见,对本书质量的提高有很大帮助,在此表示衷心的感谢。
由于译者水平所限,书中难免有错误和不当之处,欢迎专家和读者批评指正。邮件请发至baiyong666ai@qq.com。另外,读者可加入本书的QQ交流群(群号:891515375)。