Visual C++数字图像模式识别技术详解
上QQ阅读APP看书,第一时间看更新

1.1 数字图像处理概述

数字图像处理也称为计算机图像处理,是指将图像信号转换成数字格式并利用计算机对其进行处理的过程。数字图像处理起始于20世纪50年代,并于20世纪60年代初期形成一门独立学科。目前,数字图像处理技术作为自动化、信息化的一个重要手段广泛应用于各行各业的工作环节中,为提高其工作效率和工作精度作出了不可忽视的贡献。正因为如此,图像处理理论和技术受到了越来越广泛的重视。

1.1.1 数字图像获取

图像是指自然景物存储在各种介质上的视觉信息。这类原始图像也称为模拟图像。计算机无法直接处理模拟图像,而需要将其转换成数字图像并采集到计算机中再进行处理。这一过程称为数字图像获取。

数字图像获取一般包括图像摄取、转换及数字化等几个步骤,主要由硬件实现。例如扫描仪可以将印有文字的书页转换为数字图像并采集到计算机中,它的核心元件包括光学成像部件和光电转换部件。光学成像部件由灯管、反光镜、镜头以及电荷耦合器件组成。扫描仪工作时,灯管发出强光照射书页;镜头在反光镜辅助下对书页图像的反光进行聚焦,并由电荷耦合器件进行光采集,生成关于书页的图像。这种图像还需由光电转换部件将其转换成计算机可以识别的二进制数字格式,即生成最终的数字图像。最后,扫描仪通过通信接口将数字图像传送至计算机中完成整个书页图像的获取。

1.1.2 图像显示与存储

图像采集到计算机中,是以图像文件的形式存储的。在需要使用时,由应用程序对这些文件进行读取及信息处理。

1.图像显示

图像在计算机屏幕上的显示,实际上是从存有图像数据的图像文件中取出数据,再按计算机显示电路的要求送到显示存储器和调色板中的过程。其中,显示存储器中的数据是关于在计算机屏幕不同位置上显示的颜色值,而颜色的定义则由调色板控制。同时,从图像文件头中可取得图像的各种参数,这些参数用于控制图像的显示。如果文件中数据的存储形式与显示模式不一致,还需进行类型转换。

2.图像存储

显示在屏幕上的图像,其调色板寄存器和显示存储器中的数据可用专门编制的程序读出。图像参数可以在显示过程中得到。屏幕图像的存储过程按显示过程的相反方向进行。

1.1.3 数字图像文件

为了对数字图像文件进行正常存取,这里介绍数字图像文件的文件结构。尽管图像文件种类繁多,但其结构是相似的。

1.图像基本类型

为了更清楚地解释数字图像文件结构,先简单介绍数字图像按颜色分类的基本类型。

(1)二值图像

一幅二值图像的像素值仅由0、1两个值构成,“0”代表黑色,“1”代表白色。由于每一像素取值仅有0、l两种可能,所以计算机中二值图像像素的数据类型通常为1个二进制位。

(2)16色图像

一幅16色图像像素值的取值范围为[0,15]。由4个二进制位表示。实际上,0~15并不代表具体颜色,而是调色板中16种颜色的索引值。由于这类图像只能显示16种颜色,因此显示效果不是很精细,目前只在图标等较少的场合中有应用。

(3)256色图像

一幅256色图像像素值的取值范围为[0,255]。由8个二进制位表示。和16色图像一样,0~255也不代表具体颜色,而是调色板中256种颜色的索引值。和16色图像相比,由于可显示颜色更丰富了,显示效果得到明显改善。

256色图像更重要的一种应用格式是256灰度图像。256灰度图像实际上是256色图像的一个特例。图像像素值的取值范围仍然是[0,255],但每一个数值代表一种灰度,“0”表示纯黑色,“255”表示纯白色,中间的数字从小到大表示由黑到白的过渡色。就文件格式而言,256灰度图像仍然采用256色图像的格式,只不过其调色板中256种颜色已明确由小到大定义成不同灰度颜色。由于256灰度图像去除了颜色信息,因此,在很多图像分析场合,尤其是数字图像模式识别应用中较常用。

(4)真彩色图像

和上述图像不同,真彩色图像的像素值直接表示具体颜色,因此没有调色板。一般真彩色图像的每个像素值由三个字节组成,分别表示红(R)、绿(G)、蓝(B)三原色的亮度值。组合在一起,真彩色图像共可以表示256×256×256=16777216,或16M种颜色。由于真彩色图像所能表示的颜色数量已经超过人眼所能分辨的颜色数量,因此,实际应用中认为真彩色图像的显示效果和数字化前的原始图像是一样的,这也是真彩色图像名称的由来。

2.图像文件结构

在计算机中,数据以文件的形式存储在外存储器中,图像数据也不例外。图像文件就是以数字形式存储的图像。为了便于读写,图像数据一般以一定的格式存放。目前已知有几十种图像文件格式,它们虽各不相同,但都具有相似的特征。图像文件一般由文件头、像素数据和调色板数据3部分组成。

(1)文件头

文件头用于存放图像基本信息,包括各种特征参数、像素数据与调色板数据在文件中的存放位置,以及文字注解等。它分固定格式和灵活格式两大类。前者如BMP、PCX文件等,它们存储规定的参数,且数据在文件中的存储位置是固定的。后者如TIF文件,文件中除了规定的参数外,还可自定义特征参数,数据在文件中的存储位置也不固定,且同一文件中还可存放多幅图像。还有一些格式介于两者之间,如GIF和TGA文件格式。

(2)像素数据

像素数据以位图的形式存放,每个像素数据对应图像相应位置上的颜色值,具体颜色值的定义由调色板数据提供。像素数据有压缩和不压缩之分。压缩数据可以节省存储容量,但在存取时需进行压缩和解压缩处理,处理速度稍慢。不压缩的像素数据在不同格式的图像文件中的存储结构基本相同。

(3)调色板数据

调色板数据是指二值、16色和256色彩色图像的色调数据,真彩色图像的像素数据中已有颜色分量,故不再需要调色板数据。有些图像文件格式中调色板数据放在文件头中。有的文件中还有输入、输出设备及存储介质的光学特性曲线等,据使用场合的不同而不同。图像显示时需要调色板数据。

3.图像文件常用参数

在图像的显示控制中最为重要的参数包括图像的宽度、高度、每像素所占位数、位平面数、图像类型、像素数据存储位置、调色板数据存储位置、压缩类型和图像扫描方向等。它们可分为图幅参数、类型参数、位置参数和其他参数等4类。

(1)图幅参数

图像的宽度和高度是图像的基本参数。由图像宽度可以计算出每行字节数,即由图像宽度乘上每像素字节数直接求得,但有的图像格式要求每行字节数是4的倍数(如BMP文件)或偶数(如PCX文件),计算时需作调整。

(2)类型参数

图像的每像素所占位数、位平面数决定了图像的存储结构。每像素所占位数与位平面数相乘可得每像素所占总位数,由它可以计算出图像中用到的色彩数,后者决定了图像所需调色板中色彩的数量。总位数1、4、8分别对应于色彩数2、16、256。总位数为24时图像是真彩色图像,它不需要调色板数据,故色彩数为0。得到每像素所占位数和位平面数后,就可以确定图像的类型。

有的图像类型还特别注明图像是黑白还是彩色。有了这个参数,黑白图像文件中可以省略调色板数据(如TIF、TGA文件)。

(3)位置参数

像素数据和调色板数据的存储位置用于对图像数据的存数、取数指针进行定位。它们的存放位置可以是固定的,也可以是不固定的,因不同文件而不同。

这里,需注意的是图像扫描方向或数据存储顺序。大多数图像文件采用的扫描方向为自上而下(如PCX、GIF、TIF与JPEG文件),少数为自下而上(如BMP、TGA文件)。因此,在对读取图像数据进行显示或处理时,需按照文件类型进行相应调整。

(4)其他参数

压缩类型用于注明图像文件是否压缩,采用何种压缩等,供存数、取数程序确定是否需要压缩和解压缩。

综上所述,尽管计算机中存储的图像文件类型繁多,但不同类型的图像文件均可由图像中每像素所占位数和位平面数等图像类型参数来区分,如表1-1所示。图像文件按每像素所占总位数可分为4类,即黑白二值、16色彩色、256色彩色和24位真彩色。有些图像文件中用图像类型这个参数来区别黑白图像和彩色图像。表1-1中,pal表示该文件类型采用调色板,需要调色板数据;rgb表示彩色分量排列顺序为红、绿、蓝,bgr则相反,为蓝、绿、红;bw、wb则省略调色板,前者表示黑白图像中零值为黑色,高数值为白色,后则相反,零值为白色,高数值为黑色;*表示该类图像支持的数据类型。

此外,16色彩色和真彩色图像可分为第一位平面结构与多位平面结构两类。单一位平面结构下,图像数据以像素为单位集中存放,与显示存储器中的存放形式相同。而图像文件中的多位平面存储结构与显示存储器中的有所不同,它是按行为单位存放的。在同一行中图像数据以颜色分量为单位集中在一起,每个位平面相当于一行黑白图像,几个位平面的数据依次存放。

表1-1 图像文件类型参数

1.1.4 数字图像处理

数字图像处理即针对在空间上离散的,在幅值上量化分层的数字图像,采用一些特定数理模式进行加工处理,以达到有利于人眼视觉或某种接收系统所需要的图像的过程。数字图像处理的方法主要包括:图像变换、图像增强、图像复原、图像压缩编码等。这部分处理也称作数字图像的预处理。其基本特点是输入和输出均为图像。在此基础上,可以进行图像分析,模式识别等内容研究。一般认为图像分析和模式识别是和图像预处理相对独立的另两个部分。其基本特点是输入的是图像,输出不为图像,而是对图像的分析和特征分类,或对图像的描述和解释。