2.5 人脸图像分形编码算法实验结果
2.5.1 三种分形编码算法的性能比较
针对Lena图像(256×256,8bits)分别利用Jacquin、Fisher和小波变换与分形相结合方法进行编码,对三种方法的实验结果进行比较。在实验过程中,先把原Lena图像(256×256)做一维小波分解,得到像素为128×128的低频子图[如图2.11(c)所示],经归一化使图像变为256×256像素。按照2.2节和2.3节给出分形编码算法得出的实验结果如图2.11所示。
图2.11 三种分形编码算法解码图像
表2.1给出的实验结果表明,在PNSR相差不大的情况下,小波分形编码算法取得了较高的压缩比,提高了分形编码的速度,在较大程度上克服了经典分形编码方法的压缩时间过长的缺点。
表2.1 不同分形编码算法的性能比较
2.5.2 基于小波变换的人脸图像四叉树分形编码
人脸是人类视觉中最常打交道的对象这一,也是诸如可视电话(Videophone)和会议电视(Telephone)中主要传输的对象。由于人脸图像数据量巨大,因此研究人脸图像的高倍压缩,是低带宽条件下的可视电话、会议电视进行信息传输的客观要求。同时,完善人脸这一特定类图像的压缩算法,可以进一步促进人脸信息存储、人脸特征提取与识别系统的应用与发展。
1.四叉树人脸图像编码参数的确定
针对ORL图像库中的一幅标准的人脸图像模式(92×112×3)进行编码,并通过计算编解码后的图像与原图像之间的欧氏距离,得到最佳参数下的解码图像。
在编码和解码过程中都有一些参数,这些参数的任何改变都直接影响到分形编码的效果。编码过程中的主要参数有最小最大深度(-m, -M)、Domain集类型(-D)、比例系数(-s)、偏移系数(-o)等,解码过程中的主要参数有迭代次数(-n)、比例系数(-s)、偏移系数(-o)。
尽管参数的不同选择,对编码解码后的图像效果有很大的影响,但这些影响并非都是肉眼可以直接分辨的,可以用欧氏距离测量编码前和解码后的图像之间的差别。
令p和q是欧氏空间中两幅高为H、宽为W的图像,p(i)和q(j)为(i,j)点对应像素的灰度值,其中1≤i≤H,1≤j≤W,则其欧氏距离定义为
这里,p一直为图2.11中的原始图像,而q为每次选不同参数时的编解码后的图像。
在编码过程中,首先对输入图像分块,分好块后要对每一个R块寻找一个与之匹配的D块,这个D块比R块大一倍。如果在指定的最小误差范围内找不到,则此Range块R要再次一分为四,然后重复此匹配的过程。下面对编码过程中各种参数对编解码过程的影响进行实验分析,以便探讨特定条件的最佳参数范围。
(1) 最小最大深度(-m, -M)对编解码的影响
最小深度就是对原图像分割的最大的Range块时的深度级,最大深度是指原图像分割的最小的Range块时的深度级。以256×256的图像为例,可以指定最小的深度为4,最大的深度为6,这样它最大的Range块就是16×16,最小的Range块就是4×4。从最大的16×16的Range块开始寻找,当找不到与匹配的Domain块时,可分为8×8的,若再找不到,可分为4×4的,再往下就不可以了。
选取的图像是ORL中的人脸图像,这些图像都是92×112的,那么在选取最小最大深度时取了三组值,如图2.12所示。
图2.12 最小最大深度的选取
从图2.12可看出,m=3,M=5对于ORL中的人脸图像是最合适的,它对人脸图像具有最佳描述效果。因而以下的参数都是在以此组参数为基础的,也就是说在用以下参数时已选取了m=3,M=5。
(2) Domain集类型(-D)对编解码的影响
Domain集是有一些子方块图构成,这些方块不仅有大小,而且也涉及步长的大小。Domain集共分为3类(0, 1, 2),如图2.13所示。
图2.13D参数的选取
从表2.2可看出,为了保证编码图像的质量,D=2时得最佳效果。
表2.2 不同D的欧氏距离的比较
(3) 编码时的比例系数s和偏移系数o
这两个参数分别对应每个Range块的灰度比例系数和灰度偏移系数,并且是这两个系数量化后的比特数,用在存储编码结构的文件中。通过表2.3的实验数据和图2.14可知,它们的大小对编码效果影响不大,只有通过欧氏距离来判断时才可以发现它们的差异。
表2.3 不同s值的欧氏距离和o值的欧氏距离
图2.14s参数的选取和o参数的选取
由表2.3所示的实验结果可知,s=8,o=10时可得最佳效果。
(4) 迭代次数n
这是一个解码参数,迭代次数少得不到稳定图像,迭代次数多可能浪费时间因为在此之前已经得到了较稳定的图像。图2.15给出了迭代次数与编码效果的关系。
从图2.15可以看出,当迭代5~8次左右时,就已经可以得到稳定的图像了,为了保险,采用8次迭代。
(5) 解码时的比例系数s和偏移系数o
图2.15 迭代次数分别为1、2、3、4、5、6、7、8、9、10、15、20时编码的效果
在解码时,也需要这两个参数,原因是这两个参数存储在编码文件中,因而解码时也应使用与编码时相同的参数。
综上所述,人脸分形编码最佳参数选取见表2.4。
表2.4 人脸分形编码最佳参数
选取以上参数后,再进行编码解码过程,得出图2.16(b)所示的人脸图像编码结果。图2.16(a)为原始图像,图2.16(b)计算欧氏距离,得出距离为537.728,它比以上单独使用各个参数时得出的距离都小,因而联合所有最佳参数可以达到提高编码质量的效果。
图2.16 最佳参数人脸图像分形编码结果
2.在参数确定下结合小波变换对人脸图像进行分形图像编码
基于小波变换的图像压缩研究已经取得了极大的进展,相比传统的基于DCT的图像压缩(如JPEG)方法,这种算法不但压缩比例高,而且恢复图像质量也相当好。人们虽从不同角度提出了很多种各有优缺点的小波压缩算法,但由于还没有一种方法算得上是完美的,因此可以说,基于小波变换的图像压缩标准还没有出现。目前,最有希望成为标准的是SPIHT算法,该算法从本质上讲,是对EZW算法的改进,由于它充分利用了二维图像经过几级小波变换后的特性,算法复杂度低,且具有嵌入性的特点,因此对于通用的图像压缩,不失为是一个很优秀的算法;但是对于特定的图像(如人脸)而言,要取得更好的压缩效果,必须利用图像本身的统计特性。
采用小波变换出于两个方面的考虑。Nastar指出人脸的表情变化和少许遮掩只影响图像中高频部分的变化,人脸图像的低频部分在有表情变化的情况下仍然比较稳定。因此可以考虑仅对人脸图像的低频部分进行编码,而利用小波变换可以达到这个目的。图2.17是经一阶小波分解得到的人脸图像的低频子图。
图2.17 人脸图像的一阶小波分解
在选定参数下对一阶小波分解后的低频子图进行四叉树分形图像编码,并与Jacquin和Fisher方法进行比较。实验数据见表2.5。
表2.5 人脸图像分形编码结果技术指标比较
图2.18 人脸图像分形编码结果比较
表2.5所示的实验结果表明:小波分形方法具有较高的峰值信噪比,提高了分形编码的速度。
实验1中,对Lena图像(256×256, 8 bit)进行分形图像编码,结果表明基于小波变换的人脸图像四叉树分形编码方法具有很高的压缩比,大大缩短了分形编码的时间。实验2是把四叉树编码方法与欧氏距离相结合,针对ORL图像库中的一幅标准人脸模式图像(92×112×3)进行四叉树编码,通过计算编码后图像与原图像之间的欧氏距离,得到四叉树分形编码最佳参数;然后,在选定合适的正交小波基的基础上,对图像进行一阶小波分解,得到对应于图像的一个低频子图和三个高频子图;图像信号的主要能量集中在低频区域,在确定参数下对低频子图进行四叉树分形图像编码。通过与Jacquin和Fisher分形编码方法做比较,基于小波变换的人脸图像四叉树分形编码方法保证较高的PNSR(峰值信噪比),在消除了Jacquin方法中的方块效应的同时,提高了Fisher方法中的压缩比,达到了提高分形编码质量的效果。同时,较大程度上提高了分形编码的速度,克服了经典分形编码方法中编码时间过长的缺点。
分形理论在图像处理方面已经获得了一系列成功的应用,特别是分形压缩编码。现在人们已经开始将分形理论用于目标识别,由于分形压缩编码中已经携带了图像的特征,因而可以利用它进行目标图像的识别(如人脸识别)。识别的误差主要来源于分形编码的准确性,得出的分形码越接近原图像,其识别结果越准确。