第1章 绪论
1.1 虹膜识别技术概述
自美国9·11恐怖事件之后,各类恐怖事件频频发生,从中暴露出传统身份认证手段安全性差这个致命缺点,我们必须寻求更加安全可靠、使用方便的身份鉴别手段。实际上,人是独特的意味着其自身的生物特征也是独特的,由于生物特征具有唯一性、普遍性和持久性等特点,所以可以采用其本身独有的方式作为身份识别手段。同时,与传统的我所拥有的或我所知道的身份鉴别手段相比,基于生物特征识别技术的身份识别方法具有安全性高、不易遗忘或丢失、防伪性能好、可随身携带等特点。
虹膜特征识别作为生物特征识别的一种,相比其他生物特征识别技术具有较为明显的优势,被认为是最安全、最精确的识别方法。生物特征识别技术特性比较如表1.1所示。
表1.1 生物特征识别技术特性比较
续表
1.1.1 虹膜的生理结构
要想深入研究虹膜识别技术,必须对虹膜的生理构造、生理特性等进行详细了解,在此基础之上才能对虹膜识别技术有更加深刻的理解。
人出生前的随机发育过程造成了各自虹膜组织结构的差异,生物学家通过大量实验和观察发现,虹膜发育完成后,在人的一生中是稳定不变的。虹膜半径约为6mm,厚度约为0.5mm,根部较薄。虹膜表面凹凸不平,有皱褶和隐窝。血管在虹膜内分布不均匀,使虹膜内部表现出许多放射状纹理,这种纹理特征可用于身份识别。图1.1展示了虹膜结构及纹理示意图。
图1.1 虹膜结构及纹理示意图
1—瞳孔;2—巩膜;3,16—瞳孔区;4—褶皱;5,15—睫状体区;6—径向沟;7,14—隐窝;8—色素点;9—同心沟;10—瞳孔缘;11—卷缩轮;12—斑点;13—收缩沟
不同的人种,其虹膜中黑色素的含量不同,虹膜呈现的颜色也就不同,白色人种的虹膜呈蓝色或碧绿色,黑色人种的虹膜呈棕黑色,黄色人种的虹膜呈深浅不同的棕色。在可见光下可采集到白色人种清晰的虹膜图像,而对于黄色人种和黑色人种,则必须在具有一定穿透力的红外光的辅助下,才可以采集到较清晰的虹膜图像。本书的研究对象主要是黄色人种的灰度虹膜图像。
1.1.2 虹膜识别技术的发展现状
1987年,眼科专家Aran Safir和Leonard Florm首次提出了利用虹膜对身份进行认证,但是直到1991年,美国洛斯阿拉莫斯实验室的Johnson才研制出第一个虹膜识别原型系统。在现有的虹膜识别系统中,最典型也是商业化程度最高的是1993年剑桥大学Daugman研制的基于Gabor变换算法的虹膜识别系统。此外,比较典型的虹膜识别系统或算法还包括:1994年Wildes开发的虹膜身份认证系统,1997年Boles等人提出的基于一维小波变换过零检测的虹膜识别算法,2001年Lim等人提出的基于二维Haar小波变换的虹膜识别算法。在这些算法中,Wildes开发的系统只能用来进行身份认证,即1:1的比对模式,而不能用来进行身份识别,功能比较单一;其他算法应用范围较窄,仅停留在理论研究阶段。
国内对虹膜识别技术的研究起步于20世纪末。1998年,王介生研制的虹膜识别装置申请了国家专利,该装置实现了对虹膜进行自动采集、处理和匹配等功能。2000年,中国科学院自动化研究所模式识别国家重点实验室提出了基于多通道Gabor滤波器的虹膜特征识别算法,并于2001年研制出了具有我国自主知识产权的虹膜识别原型系统,中国科学院自动化研究所的虹膜识别核心算法已经非排他性授权给美国Sarnoff公司、英国IrisGuard公司及美国肯塔基大学等机构,国内中科虹霸公司推出了基于中国科学院自动化研究所虹膜识别算法的虹膜识别仪,具有极高的可靠性、准确性和防伪性。从2001年开始,国内很多科研机构相继对虹膜识别技术进行了广泛的研究,主要包括吉林大学、中国科学技术大学、上海交通大学、沈阳工业大学、哈尔滨工程大学、太原科技大学等,但以上这些机构的研究基本都还停留在理论层面,尚未有商业化应用案例。
1.1.3 虹膜识别系统原理
虹膜特征识别通过捕获模板样本,然后采用特征提取算法把模板样本转化成生物学模板,而且该模板能够提供标准化、有效、高度有区别的特征表示,这样可以客观地与其他类别特征模板进行比较以确定身份。
虹膜识别系统包括认证模式和识别模式。虹膜识别系统主要由4个部分组成:虹膜图像采集、虹膜图像预处理、虹膜特征提取、虹膜特征匹配。其系统原理如图1.2所示。
图1.2 虹膜识别系统原理
(1)虹膜图像采集:通过专业的高分辨率采集设备获取包含虹膜的人眼图像。
(2)虹膜图像预处理:包括虹膜内、外边缘定位、归一化等步骤,需要提取虹膜的有效区域,去除干扰。
(3)虹膜特征提取:利用提取算法将虹膜纹理转化为易区分的虹膜特征编码。
(4)虹膜特征匹配:将提取的虹膜特征编码与事先储存的特征模板比对,进行身份的认证或识别。
1.1.4 生物特征识别技术指标
1.生物特征识别系统工作模式
(1)认证模式(Verification):为1:1的比对模式。在该模式下,系统将生物特征与声明的身份生物特征模板进行比对,决定是否属于同一模式类,从而核实身份。认证相对识别来说范围要小得多,速度要快得多。
(2)识别模式(Identification):为1∶N的比对模式。在该模式下,系统在生物特征模板数据库中搜索能够与待识别生物特征相匹配的记录,确定待识别生物特征属于哪一类,从而确定身份。
2.常用的生物特征识别技术指标
(1)错误接受率(False Accept Rate,FAR):系统将不属同类的虹膜模式误匹配为同一类,其定义为
(2)错误拒绝率(False Reject Rate,FRR):系统将属同类的虹膜模式误匹配为不同类,其定义为
(3)相等错误率(Equal Error Rate,EER):也是常用衡量系统识别性能的指标之一。它对应于FAR和FRR相等时对应的值。EER越小,系统的性能越高。
(4)总错误率(Total Error Rate,TER)为
(5)总精确率(Total Accuracy Rate,TAR)为
(6)在识别模式下,可用正确识别率(Correct Recognition Rate,CRR)衡量系统性能,即
受采集设备、环境和用户姿态等多种因素的影响,即使来自同一虹膜的两个样本的特征向量也不会完全一致,因此在实际匹配时采用归一化的相似度或距离表示两个虹膜特征向量之间的相似程度。两个虹膜特征向量之间的相似度越大,则它们属于同类虹膜的概率就越大。同类虹膜的相似度分布为类内相似度分布,不同类虹膜之间的相似度分布为类间相似度分布,典型虹膜特征识别系统的相似度分布图如图1.3所示。T表示分类决策阈值,如果虹膜样本特征与特征模板之间的相似度大于T,则认为它们属于同一类,否则认为它们不属于同一类。对于一个给定的系统来说,T的选择将对FAR和FRR产生影响。FAR随着T的增大而降低,而FRR随着T的减小而上升。T应根据不同场合进行选择,如在军事、银行等领域,安全是第一位的,所以应选择较大的T,使冒名顶替者非法进入系统的可能性降到最低。而应用在门禁、考勤等一般场景时,速度是一个重要的因素,即使出现误识别的情况,也可以在事后监督中减少损失,这时可以选择较小的T,从而使识别效率提高。
图1.3 典型虹膜特征识别系统的相似度分布图
为了能从整体上更好地描述系统的性能,更好地体现FAR和FRR之间的关系,并便于不同识别算法间的比较,通常将不同T下的FAR和FRR作为横坐标和纵坐标所形成的点画成曲线,称为受试者操作特征曲线(Receiver Operating Characteristic,ROC),如图1.4所示。对于ROC曲线,其整体位置越靠近坐标原点,算法的整体性能越高。这是因为其整体位置越靠近坐标原点,在取相同FAR的情况下,FRR越小,识别精度就越高。同时,ROC曲线和y=x的交点对应的也是EER。
图1.4 生物特征识别系统的ROC曲线