深度学习之摄影图像处理:核心算法与案例精粹
上QQ阅读APP看书,第一时间看更新

前言

为什么要写这本书

这不是笔者写的第一本书,也不是最后一本书,但可能是笔者最喜欢的一本书。因为本书不仅是一本介绍计算机视觉技术的书,更是一本有前沿技术领域气息的摄影书,在科学研究中该领域被称为计算机美学或者图像美学。

10多年来以深度学习为代表的技术,为计算机视觉领域带来了很多应用,也影响了我们的生活方式,其中就包括摄影。早在10年前,笔者还在初中学习的时候,就“无可救药”地喜欢上了摄影。进入大学后,笔者经常在图书馆和计算机房“沉迷”于Adobe Photoshop、Adobe Afects、Adobe Premiere等软件。虽然在大学的时候,笔者的专业并不属于计算机视觉领域,但笔者最终进入了这个领域并一直深爱着,应该就是缘于早期对图像的喜欢吧。

总的来说,笔者和计算机视觉、摄影的结缘应该分为3个阶段。

第1阶段:中学的时候,笔者喜欢拿着胶片相机拍摄,彼时并不富裕,拍摄成本较高,但也正因如此,笔者对拍摄的每一张照片都非常珍惜。到武汉上大学后,笔者拥有了属于自己的数码相机,这一方面拉开了“穷游”和摄影的序幕,另一方面开始喜欢利用摄影摄像类软件创作作品。不仅沉迷摄影,还经常摸索各类软件的使用方法,将照片做成视频相册。大学毕业时班级的视频是笔者编辑创作的,研究生毕业时班级的视频也是笔者编辑创作的。大学里笔者曾加入学校的网络电视台,也曾自编、自导、自演拍摄影片作为英语课小组结课作业。这个阶段,属于自娱自乐、爱好摄影和视频编辑的“萌新”期。

第2阶段:研二时笔者“转行”进入图像处理领域,主要进行传统的图像处理算法研究和应用开发,此时笔者开始建立专业的图像处理知识体系,并一直延续到今天,而且还会持续下去。这个阶段,属于学习和掌握底层图像处理知识的成长期。

第3阶段:始于3年前,笔者正式入手了自己的第一台微单Canon EOS M3,开始真正接触较专业的摄影设备,“玩转”以前所用的相机无法支持的技术,包括快/慢门、长焦微距、延时摄影等,并开始研究美学、构图、光线使用技巧。如今,笔者已经拍摄超过10000张猫咪照片、数万张风光照片。这个阶段,属于真正开始“玩转”摄影,并利用所学的图像处理知识进行总结、输出的收获期。此外在这个阶段,笔者完成了本书的写作。

摄影与拍照不同,它饱含孤独,让人“痴狂”。它不仅仅是记录,更是追寻,与自己的对话,独处,思考,对生活细微处的热爱,对美景的无限渴望。

为了拍摄照片,笔者曾5天内独自辗转游历3个从未踏足的国家,只为追寻几处美景;曾3天内独自夜入沙漠,环绕沙漠徒步,只为观日出日落;曾半天内登4座山峰,只为寻找观看草原日落的绝佳视角;曾多次临悬崖、攀高楼,只为体验“一览众山小”的意境;曾在一个暑假给家里的猫拍摄了数千张照片;曾在没有三脚架的夜里在北京的瑟瑟寒风中拍摄长曝光夜景。

至今,笔者才算真正地有点懂摄影了。摄影已成为笔者的生活方式。

笔者一直在计算机视觉领域中积累经验,见证了传统的图像处理算法到当前深度学习等技术给我们生活带来的改变。

终于在一年多前,笔者积累了足够多的摄影作品,进入了图书创作领域,在人民邮电出版社编辑的“牵线搭桥”下,开始了本书的创作。

要“玩转”摄影,尤其是摄影的后期,需要学习与以Adobe Photoshop为代表的图像处理软件相关的很多技能,具有一定的门槛。近年来,深度学习等技术的发展使得很多摄影后期创作变得越来越智能,本书力图给大家系统地介绍相关技术。

本书的写作历时将近一年,其中一部分时间用于整理技术内容,另一部分时间则用于采集图片素材,书中几乎所有的照片都是笔者独立拍摄完成的。

本书聚焦于摄影学中的图像处理算法,尤其是深度学习技术在摄影学中的应用。在本书出版之前,笔者在500px(中国)、图虫网等社区分享了许多摄影作品,在微信公众号、知乎等平台分享了许多图像处理技术知识,本书可以看作一个更加系统的总结。读者也可以持续关注笔者在以上平台的账号,获取更新的内容。

本书特色

1. 循序渐进

本书首先从摄影的基本概念,尤其是其涉及的图像知识开始讲述,然后过渡到摄影与图像交叉的各个领域。

本书从摄影作品的美学质量评估算法、自动构图算法,过渡到对摄影作品的常用编辑技术,包括噪声去除、对比度增强、色调增强、去模糊及分辨率提升,然后介绍了人像美颜、图像风格化技术,最后介绍了难度较大的图像景深编辑、图像融合技术等。本书内容由浅入深,覆盖了大量应用场景,适合系统性进阶学习。

2. 内容全面与前沿

本书内容全面,紧跟前沿。全书共9章,其中第2章~第9章对摄影中的图像评估和编辑等各个方向的技术和应用进行了介绍。虽然本书主要专注于深度学习技术,但是在这几章中,笔者仍然会首先介绍重要的传统算法,方便读者对以前的技术进行学习和融会贯通;随后重点介绍深度学习技术近年来的发展脉络。

3. 理论与实战紧密结合

本书完整剖析了摄影中所使用的图像处理算法,对应章节不停留于理论的阐述和简单的结果展示,而是从夯实理论到实战讲解一气呵成。相信读者通过对本书的学习,在对图像美学算法甚至是摄影作品本身的理解方面,一定会有所收获。

4. 图片清晰丰富

本书几乎所有的图都是笔者独立拍摄或绘制的,既保证了内容的原创性,又保证了图片的质量,力图让本书成为一本“高颜值”的算法图书。

本书内容及体系结构

0

本书读者对象

本书是专门讲解摄影图像中所使用的算法和应用的书籍,对读者的基础有一定的要求。

  • 读者最好已掌握基本的数学知识,包括概率论、矩阵论、最优化理论等,要有一定的传统数字图像处理和计算机视觉理论基础。
  • 读者需要对摄影基本理论有一定的了解并且具有实践经验,或者对此类知识感兴趣。
  • 读者需要具备利用Python等语言编程的能力,有一定的Cafe、TensorFlow、PyTorch等主流的深度学习框架的知识储备。

本书适合以下读者。

  • 摄影爱好者,图像处理技术爱好者。
  • 需要了解深度学习在图像质量、计算机美学等领域的算法原理和应用的院校或培训机构的老师和学生。
  • 从事或者有志从事图像质量、计算机美学等领域的研究人员和工程师。

勘误

本书的作者龙鹏,笔名言有三,毕业于中国科学院大学,成书时有超过5年的深度学习领域从业经验、超过7年的计算机视觉领域从业经验,创办了“有三AI”微信公众号和“有三AI”知识星球等。

因受作者水平和成书时间所限,书中难免存有疏漏之处,敬请广大读者关注作者的账号,欢迎沟通并指正。

致谢

笔者完成本书写作的过程中得到了一些帮助。

感谢冯婷婷在第1章中摄影简史部分以及鲍晓杰在第2章中图像美学基础部分的内容支持。

感谢人民邮电出版社编辑的信任,联系我写作了本书,并在后续的出版流程中付出了努力。

感谢曾经的“有三摄影工作室”微信公众号的粉丝们和曾经的摄影小分队小伙伴们的支持,相信某一天我们还会重聚。

感谢“有三AI”微信公众号、“有三AI”知识星球的忠实粉丝们,是你们的阅读和支持让我有了坚持前行的力量。

感谢书中GitHub开源项目的贡献者,是你们无私的技术分享,让更多人受益匪浅,这是这个技术时代里非常伟大的事情。感谢提出各个方法和算法的研究人员,你们的辛苦使我能够“站在巨人的肩膀”上完成本书的内容。

最后,感谢我的家人,因为事业,陪伴你们的时间很少,希望以后我会做得更好。

00
2021年3月1日于北京