1.1 图像概述
这里先给出一些图像的基本概念和术语的简短定义(详细解释见后),然后展示一些各种类型的图像范例,最后罗列一些图像应用的领域。
1.1.1 基本概念和术语
1. 图像
图像是用各种观测系统以不同形式和手段观测客观世界而获得的,可以直接或间接作用于人眼并进而产生视知觉的实体。图像带有大量的信息,如百闻不如一见、一图值千字都说明了这个事实。在实际中,图像这个概念是比较广义的,如照片、绘画、草图、动画、视像等都是图像的形式。可见,所有人的视觉对象都是图像,更准确地说是连续图像。
2. 连续图像
连续图像源自客观世界中景物的影像,是人眼直接感受到的图像(视觉对象),也称模拟图像。
3. 视觉
视觉是人用眼睛观测世界,并用人脑感知世界的一种能力,也是人类观察世界、认知世界的重要功能手段。视觉是人类从外界获得信息的主要源泉。据统计,人类从外界获得的信息约有75%来自视觉系统,这既说明视觉信息量巨大,也表明人类对视觉信息有较高的利用率。
4. 视觉系统
视觉系统是通过观测世界获得图像,并进而实现视觉功能的系统。人的视觉系统包括眼睛、神经、脑皮层等器官。随着科技的进步,由计算机和电子设备构成的人造视觉系统也越来越多,它们试图实现并改善人工视觉系统。人造视觉系统主要使用数字图像作为计算机的输入。
5. 数字图像
数字图像是对连续图像数字化或离散化的结果,也称离散图像。早期英文书籍里一般用picture代表图像。随着数字技术的发展,现都用image代表离散化了的数字图像(所以中文用“图象”这个词应更合理)。本书讨论的基本都是用电子设备获得的且用计算机技术来加工的数字图像,在不引起歧义的时候,均只写图像。
6. 图像技术
图像技术指利用计算机和电子设备对图像进行各种加工的技术。这里被加工的都是数字图像,所以也有人称为数字图像技术。但正如上所述,本书均用图像技术来代表。两类比较基本和应用广泛的图像技术是图像处理技术和图像分析技术,将在后面各章节展开讲述。
7. 图像处理技术
图像处理技术主要关注的是通过对图像的加工获得更好的视觉观察效果,或在保证一定的视觉观察效果的基础上减少图像存储所需的空间或传输所需的时间。
8. 图像分析技术
图像分析技术主要关注的是对图像中感兴趣的目标进行检测和测量,以获得各种描述目标特点和性质的客观数据和信息。
1.1.2 不同波段的图像示例
图像反映了客观世界中景物的映像,呈现出亮度模式的空间分布。图像成像可借助各种电磁波辐射(包括可见光)来实现。电磁波谱很宽,各种电磁波的波长从短到长依次为:宇宙γ射线(伽玛射线及宇宙射线)、X射线(伦琴射线)、紫外线、可见光、红外线、无线电波(包括微波)、交流电。由不同波长的电磁波所获得的图像有不同的特点,下面依次介绍。
1. 宇宙γ射线图像
γ射线是原子核受激后产生的电磁波,其波长非常短(常达约0.001 nm,更短的电磁波常称宇宙射线,也有人把γ射线看作宇宙射线一部分的),但能量非常高(甚至高于1011eV)。图1.1.1所示是几幅天文方面所获得的γ射线图像。
图1.1.1 宇宙γ射线图像示例
2. X射线图像
X射线是原子受激后产生的电磁波,其波长在0.001~10 nm。它具有很高的穿透本领,能透过许多对可见光不透明的物质,如墨纸、木料等,所以常用于医学诊断和治疗,也常用于晶体结构分析等。图1.1.2所示是几幅对人体不同部位获取的X射线图像,展示了肉眼不能直接观察到的人体内部的结构信息。
图1.1.2 X射线图像示例
图1.1.3所示是一幅利用反向散射Х射线成像获得的人体轮廓图像,从中可检测出被隐藏枪支的轮廓和位置。这在安全监测等领域很有用。
图1.1.3 利用反向散射Х射线成像获得的人体轮廓图像示例
3. 紫外线图像
紫外线是物质外层电子受激发后产生的电磁波,其波长约在10~400 nm,比可见紫色光还短。紫外线还可进一步分为真空紫外线(10~200 nm)、短波紫外线(200~290 nm)、中波紫外线(290~320 nm)、长波紫外线(320~400 nm)。图1.1.4所示是两幅天文方面的紫外线图像。由于宇宙正在膨胀,远处星系辐射来的紫外线的波长变长而成为可见光。在图1.1.4里,左图对应旋涡状星系的星暴区,而右图则展示了两个星系之间的冲撞。
图1.1.4 紫外线图像示例
4. 可见光图像
可见光是人眼能直接感受到的电磁波,其波长约在400~800 nm。其中不同的波长对应不同的颜色:紫光(400~430 nm)、蓝光(430~460 nm)、青光(460~490 nm)、绿光(490~570 nm)、黄光(570~600 nm)、橙光(600~630 nm)、红光(630~750 nm)。这些从红色到紫色的不同颜色的光可从日常的白光中借助三棱镜分离出来,如图1.1.5所示。本书中讨论的图像处理和分析技术主要用可见光图像转化来的灰度图像进行介绍,有关彩色图像的更多介绍见第13章。
图1.1.5 由日光中分离出不同颜色的光
人们日常观察到的图像主要是借助可见光获得的,可见光图像使用得也最广泛。需要指出,虽然利用同一光源的光谱(一定的波长范围,如日光)来成像,但由于照射条件(光源的照度、角度或光源与成像物间的方位等)的不同,所获得的图像及反映的细节也会不同。例如,图1.1.6所示是一组不同光照角度下的人脸样本图像。
图1.1.6 不同光照图像示例
5. 红外线图像
所有高于绝对零度(–273℃)的物质都可以产生红外线。红外线的波长比可见红色光还长,约在0.78~1000 μm,有比较强的穿透浓雾的能力。红外线还可进一步分为近红外(0.78~1.5 μm)、中红外(1.5~6 μm)、远红外(6~1000 μm)。
图1.1.7所示是几幅红外线图像(常称红外图像)。左图是对一个读报人拍摄的图片,反映了人体不同部位热度的分布。中图是有大火和浓烟时拍摄的图片,红外线穿透浓烟给出了人的位置。右图是飞机航拍得到的图片,不同的亮度指示了地面不同植被的分布情况。
图1.1.7 红外线图像示例
6. 无线电波图像
无线电波广泛使用在无线电广播、电视、雷达、手机、通信等领域,其波长范围比较大,包括微波(1~10.000 mm)、短波(10~50 m)、中波(50~3000 m)、长波(3~50 km)。其中,微波又可细分为毫米波(它对金属比较敏感)、厘米波和分米波。无线电波图像是借助各种无线电波得到的。图1.1.8所示是两幅毫米波全身扫描成像系统的图像,左图(可见光图)反映了乘客通过安全门接受检查的情况,右图对应系统的屏幕显示,其中左列两图是借助毫米波成像获得的。
图1.1.8 毫米波全身扫描成像系统
7. 交流电波图像
交流电波的波长常在上千km,如频率为50 Hz的家用交流电的波长达6.000 km。交流电波图像与交流电场有密切联系。电阻抗断层成像就是一种利用交流电场和第6章介绍的从投影重建图像技术原理工作的一种成像方式。图1.1.9所示是利用电阻抗断层成像得到的两幅图像。
图1.1.9 电阻抗断层成像的图像示例
1.1.3 不同类型的图像示例
图像的概念近年有许多扩展。虽然以前一般谈到的图像常指2-D图像,但3-D图像、彩色图像、多光谱图像、立体图像和多视图像等也越来越多见。虽然以前一般谈到的图像常指静止的单幅图像,但运动的图像序列(如电视和视频)等也逐步得到了广泛的应用。虽然图像常用对应辐射量强度的灰度点阵(彩色图像可结合使用3个灰度点阵)的形式显示,但图像灰度代表的也可能是景物的深度值(如深度图像)、景物表面的纹理变化(如纹理图像)、景物的物质吸收值(如投影重建图像)等。下面对这些类型的图像各举几个例子。
1. 彩色图像
彩色图像是用三个性质空间(如R、G、B)的数值来表示的,能给人以彩色感觉的图像。彩色图像在空间上(类似于灰度图像)可以是2-D的,但在2-D空间每个点同时有三个值(表示三种性质)。图1.1.10所示是几幅典型的彩色图像,色彩都比较鲜艳。
图1.1.10 彩色图像示例
每幅彩色图像可看作由三幅代表R、G、B强度的无彩色图像结合而成。图1.1.11(a)所示的一幅彩色图像是由图1.1.11(b)所示的R分量、图1.1.11(c)所示的G分量和图1.1.11(d)所示的B分量结合而成。更多关于彩色图像的介绍见第13章。
图1.1.11 彩色图像及其三个分量图
2. 多光谱图像
多光谱图像也称多波段图像,是包含多个(几个到几十个)频谱段的一组图像。每幅图像对应一个频谱段。遥感图像一般均为多光谱图像,它是对同一个场景以不同波段的辐射进行成像而得到的。图1.1.12(a)所示的两幅图像分别是用不同波长的辐射对同一个场景获得的,很明显它们反映了场景的不同特性。图1.1.12(b)所示的两幅图像分别为Landsat地球资源卫星所获得的TM(thematic mapper)多光谱图像和SPOT遥感卫星所获得的SPOT全色图像,它们在光谱特性方面也有不同。
图1.1.12 遥感图像示例
3. 纹理图像
纹理图像侧重反映物体表面的特性,因为纹理是物体表面的固有特征之一。例如,图1.1.13所示是三幅不同的纹理图像,其中图1.1.13(a)是砖墙的图像,含有全局有序(常由一些类似的单元按一定规律排列而成)的纹理;图1.1.13(b)是一块木疤的图像,含有局部有序(在图中局部区域的每个点存在某种相对一致的方向性)的纹理;图1.1.13(c)是软木的图像,纹理是无序的(既无单元的重复性也无明显的方向性)。对纹理有不同的表达和分类方法,第12章还有更多的介绍。
图1.1.13 纹理图像示例
4. 立体图像
为获得场景中的深度信息,可以仿照人类视觉系统,利用双目立体视觉技术,即借助(多图像)成像技术从而获取场景中物体的距离(深度)信息。
立体图像最常用的是双目图像(也称立体图像对),近年也有许多方法采集和利用多目图像(有时也称多视图像)。一般双目图像是将相机左右并排放置获得的,两幅图像根据相机位置分别称为左图和右图。有时双目图像也可将相机上下并列放置而获得,此时两幅图像根据相机位置分别称为上图和下图。图1.1.14所示是相关的两对立体图像,其中图1.1.14(a)和图1.1.14(b)构成一对水平立体图像的左图和右图,图1.1.14(b)和图1.1.14(c)构成一对垂直立体图像的下图和上图。
图1.1.14 相关的两对立体图像
5. 深度图像
深度图像是指其灰度反映场景中景物与摄像机之间距离信息的图像。从深度图像可获得的信息并不是景物的亮度而是景物的3-D结构信息。例如,由图1.1.14(a)和图1.1.14(b)的一对立体图像计算得到的深度图像如图1.1.15(a)所示,由图1.1.14的三幅立体图像计算得到的深度图像如图1.1.15(b)所示(效果更好一些)。图中浅色表示较近的距离值,深色对应较远的距离值。
图1.1.15 深度图像示例
6. 3-D图像
3-D图像一般是指其坐标空间为三维,需要用三元函数f(x, y, z)来表示的图像。3-D图像可看作由一系列2-D图像叠加而成。例如,图1.1.16所示是一组2-D细胞切片图像。这些2-D图像依次对应3-D图像的不同层,将它们结合起来就可以获得3-D图像,完整地表示整个细胞的全貌。另一方面,视频图像也可看作3-D图像,用f(x, y, t)来表示,这将在第14章专门进行介绍。
图1.1.16 对应D图像示例
7. 序列图像
序列图像是指时间上有一定顺序和间隔、内容上相关的一组图像,也称图像序列或运动图像,可如上所述用f(x, y, t)来表示。视频图像是一种特殊的序列图像,其中的每幅图像称为帧图像,帧图像之间的时间间隔常是固定的。图1.1.17所示是一个由8幅帧图像构成的一个图像序列,描述了一段乒乓球比赛中的场景。更多关于视频图像的介绍见第14章。
图1.1.17 图像序列示例
另外,也有一些图像序列中各图像采集的时间间隔并不一致,这些图像只是反映了事件进程中不同的几个状态或时刻。图1.1.18所示是反映眨眼过程的几幅图像。
图1.1.18 间隔不固定的图像序列示例
8. 投影重建图像
投影重建图像是指利用计算机从景物的投影出发重构复原出来的图像(详见第6章)。投影重建的方法很多,最常见的是利用计算机断层扫描,所得到的图像又可分为发射断层(CT)图像,正电子发射(PET)图像和单光子发射(SPECT)图像。图1.1.19(a)、图1.1.19(b)和图1.1.19(c)所示的分别是一幅示例图像。
图1.1.19 CT图像、PET图像和SPECT图像示例
磁共振(MRI)图像也是利用投影重建原理获得的(参见第6章)。图1.1.20所示是几幅MRI图像。
图1.1.20 MRI图像示例
另外,雷达图像也是利用投影重建原理获得的。图1.1.21所示是两幅合成孔径雷达(SAR)图像。
图1.1.21 合成孔径雷达图像示例
9. 合成图像
真实图像是从客观世界获得的,但在对图像技术的研究中,有时为了保证研究的客观性和通用性,或集中考虑特定的技术特性,也常根据需要构建合成图像以作为参考图来测试技术的性能。这样做的好处是研究结果不受限于具体的应用,可重复性强。这样构建的图像应能反映客观世界,除把应用领域的知识结合进去外,还应适应诸如图像内容的变化、各种获取图像的条件等实际情况。
图1.1.22所示是一组合成的用于分割评价的试验图。这些图均为256像素×256像素、256级灰度图。基本图是将亮的圆形目标放在暗背景正中而得到的。图中目标与背景间的灰度对比度均为32,叠加的噪声均为零均值高斯随机噪声。从左至右8列图中的目标面积分别为全图的20%、15%、10%、5%、3%、2%、1%、0.5%,从上至下4行图的信噪比分别为1、4、16、64。
图1.1.22 分割评价试验图示例
1.1.4 图像应用领域
图像已在许多领域得到了广泛应用,下面是一些典型的例子。
(1)视频通信。如:可视电话、电视会议、按需电视(VOD)、远程教育。
(2)文字档案。如:文字识别、过期档案复原、邮件分捡、办公自动化、支票、签名辨伪。
(3)生物医学。如:红白血球计数、染色体分析、X射线、CT、MRI、PET图像分析、显微医学操作、对放射图像和显微图像的自动判读理解、人脑心理和生理的研究、医学手术模拟规划、远程医疗、远程手术。
(4)遥感测绘。如:矿藏勘探、资源探测、城市规划、气象预报、自然灾害监测监控。
(5)工业生产。如:工业检测、工业探伤、自动生产流水线监控、邮政自动化、移动机器人,以及各种危险场合工作的机器人、无损探测、金相分析、印制板质量检验、精细印刷品缺陷检测。
(6)军事。如:军事侦察、合成孔径雷达图像分析、巡航导弹路径规划、精确制导、地形识别、无人驾驶飞机飞行、战场环境/场景建模表示。
(7)智能交通。如:太空探测、航天飞行、公路交通管理、自动行驶车辆。
(8)公安安全。如:突发事件监测,罪犯脸形合成、识别、查询,指纹、印章的鉴定识别。图1.1.23所示是一个监控场景的画面。
图1.1.23 利用红外检测技术在机场监控流感