基于图像分析的植物及其病虫害识别方法研究
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

2.2 植物叶片图像的分类特征

叶片是植物进行光合作用的主要器官,也是植物开展蒸腾作用的主要途径。研究植物叶片的各种参数,对植物的分类工作具有十分重要的意义。本书选取植物叶片为研究对象,运用数字图像处理技术对其进行分析并提取叶片形状的参数,以便对植物的种类和病害类型进行识别。在植物叶片及病虫害识别领域,较为常用的特征主要包括颜色、形状和纹理等特征,可以根据不同图像的特点,选择并提取合适的特征。

1.颜色特征

颜色是人们识别和记忆图像的主要特征,它对图像的尺寸、视角等方面的依赖性较小,具有较高的鲁棒性。描述颜色特征的方法主要包括颜色直方图、颜色矩和颜色集等。其中,颜色直方图表示图像中各种颜色出现的频率。颜色矩指图像中任何的颜色分布都可以用它的矩来表示,通常用一阶矩、二阶矩和三阶矩来表示图像的颜色分布。颜色集是一种对颜色直方图的近似表达,可以将图像表达为一个二进制的颜色集。

2.形状特征

形状是图像表达的一个重要特征,通常被认为是由一条封闭的轮廓曲线所包围的区域。形状特征主要包括几何特征、区域描述特征、不变矩和傅里叶形状描述等。

几何特征包括周长、面积、主轴和方向角等。图像的区域描述特征主要包括伸长度、凸凹性、复杂度和偏心度等,主要是一些区域度量值的比值,具有平移、缩放和旋转的不变性。不变矩是一种区域物体形状的表示方法,具有线性特性,对于图像的平移、缩放和旋转同样具有不变性。傅里叶形状描述可以用来作为植物叶片的分类特征,主要是用物体边界的傅里叶变换来描述其形状。

3.纹理特征

纹理特征是物体表面共有的内在特性,包括物体表面结构排列的重要信息。在图像识别领域,常用的纹理特征主要包括Tamura纹理特征、灰度共生矩阵和小波变换表示的纹理特征等。Tamura纹理特征的6个分量分别对应人类对纹理的视觉感知的6种属性,它们分别是对比度、线像度、规整度、粗糙度、方向度和粗略度。灰度共生矩阵主要反映了图像灰度分布在方向、局部邻域和变化幅度等方面的综合信息,主要包括角惯性矩、相关性、二阶矩、局部均匀性等。小波变换表示的纹理特征主要用波段在每个分解层次上能量分布的均值和标准方差来表示。

2.2.1 颜色特征

在不同季节,植物的叶片会呈现不同的颜色,而周围环境的变化同样会导致叶片的颜色发生变化。植物叶片的颜色特征可以用于叶片图像的形态学分析。正常叶片的叶绿体中有两大类光合色素,其中叶绿素和类胡萝卜素的比值是3∶1,叶绿素a和叶绿素b的比例大约也是3∶1,叶黄素和胡萝卜素的比值大约为2∶1。正常情况下,叶绿素比类胡萝卜素多,因此叶子是绿色的。当温度逐渐降低时,低温导致叶片无法合成新的叶绿素,原有的叶绿素也逐渐被破坏掉,导致叶绿素的含量比类胡萝卜素少,树叶的颜色就会由绿变黄。

在图像的颜色、形状和纹理等特征中,最容易让人识别和感知的是颜色。在提取颜色特征的过程中有以下问题需要解决:(1)如何描述颜色特征,如何根据需要来选择合适的颜色空间;(2)如何量化颜色特征,并用向量法描述选出的颜色空间。(3)如何定义不同颜色的图像之间相似度的标准。

2.2.1.1 颜色空间的选取

当前,在数字图像的颜色识别方面,专家和学者做了大量研究,结果表明人类对颜色的感知是三维的。彩色图像识别技术的关键是找到符合人类视觉的颜色模型。图像的颜色特征是由观察者的视觉系统体验和图像本身决定的。为了有效地获得目标图像的颜色特征,必须选择适合人类视觉系统的模型,例如RGB、HSV和YUV等模型。与其他模型相比,RGB模型具有方便性和通用性等优点。

人眼受到不同波长的可见光刺激时,就可以感受到不同的颜色。当有可见光刺激视网膜锥状细胞时,人眼能够感受到红、绿和蓝3种颜色,其波长分别为630nm、530nm和450nm。因为红、绿和蓝3种基色是显示彩色的基础,通常把它们称为RGB颜色模型。其他颜色都可以由RGB三基色按照不同的比例相加而成(见图2-1),因此RGB模型也叫加色模型。

图2-1 三基色原理

RGB彩色图像通常用于视频、光照及屏幕图像的编辑工作。根据三基色的基本原理,产生颜色的数量一共为255×255×255=16581375种。根据式(2-1),任意色光F都可以用RGB三基色相加得到:

其中,(255,255,255)为白色,(0,0,0)为黑色。

在图像处理过程中,HSV模型也被广泛应用。与RGB模型相比,HSV模型更符合人们的视觉习惯。HSV的3个元素是H(色相)、S(饱和度)和V(亮度),它构成了人类视觉系统的三要素。色相H表示不同的颜色,如红色、绿色、蓝色和黄色等,它的角度范围是0°~360°;饱和度S表示颜色的深度,如深色和浅色,其取值范围通常为0~1;亮度V表示颜色亮度的等级,其取值范围通常为0~1。一般而言,亮度值主要受光波能量的影响。光波的能量越大,亮度也就越大。如图2-2所示,这是HSV颜色空间模型,在一个倒置的圆锥体中,H表示角度,S表示到长轴的距离,V是长轴。圆锥顶部的亮度值最大,饱和度最高。

图2-2 HSV颜色空间模型

对人类的眼睛来说,HSV模型具有直观和容易接受的优点。一般来说,叶片图像是在不同的光照条件下拍摄的,如果使用RGB模型,将无法单独表示亮度和颜色信息;但是对于HSV模型而言,亮度和颜色信息各自独立,颜色不受亮度的影响。因此,如果采集的叶片图像是RGB模型的,就需要将其转换为HSV模型的。

YUV模型也较为常见。在该模型中,Y代表亮度,可理解为灰度值,它是独立的;U和V分别代表色差,其中U表示蓝色,V表示红色。YUV模型很简单,但能充分反映图像灰度的特点,通过失去色度信息来达到节省存储空间的目的。在图像的颜色信息压缩和存储方面,YUV模型扮演着重要角色,但也正是因为该模型在表达图像颜色方面太过简单,因此不适合进行颜色检索。

2.2.1.2 常用的叶片颜色分类特征

前文简略介绍过,描述颜色特征的方法主要有颜色直方图、颜色矩和颜色集等,下面详细介绍一下。

1.颜色直方图

颜色直方图描述的是不同颜色在图像中的占比,它是一种有效的表示图像颜色内容的方法,适用于图像检索。由于该方法不涉及颜色在图像中的空间位置,故它无法描述图像中具体的目标。通常情况下,颜色直方图用来描述那些难以进行自动分割的图像。颜色直方图有两个明显的缺点:(1)会遗漏图像的颜色空间分布信息;(2)如果颜色直方图空间的维数比较大,并且图像的数据库也比较大时,识别图像所耗费的时间也会比较长。

2.颜色矩

颜色矩是一种简单有效的颜色特征表示方法,该方法主要基于图像中任何的颜色分布均可以由其矩来表示的数学思想。实际上,颜色分布的信息主要集中于其低阶矩中,故人们通常采用颜色的一阶、二阶和三阶矩来表示图像颜色分布的信息。

3.颜色集

颜色集的思想近似于颜色直方图。该方法的主要思路是将视觉不均衡的颜色空间转化成均衡的颜色空间,并将其量化成若干个二进制文件,再用色彩自动分割技术将图像分成若干区域,而每个区域都用量化颜色空间的某个颜色分量来索引,就可以将图像表达为一个二进制的颜色集。

2.2.2 形状特征

在叶片图像识别方法的研究中,形状特征提取具有广泛的应用范围,是第一个被用于分类的标准,故对提取方法的研究相对成熟。在二维图像空间中,可以从分割图像的目标区域中获得形状特征。人们将形状特征的描述方法分为两类:一类是描述形状的区域边界轮廓特征;另一类是目标区域内所有像素的集合。根据叶片目标区域的几何轮廓和区域,利用两种描述方法可提取植物叶片图像的形状特征。

叶片的形状特征是判断叶片种类最重要、最有效的依据。一般而言,不同种类叶片的形状不同,但也不是说叶片的形状是变化无穷的,它的变化还是在一定的范围内。据统计,植物叶片较常见的形状有:针形、披针形(包括倒披针形)、矩圆形(亦称长圆形)、椭圆形、卵形(包括倒卵形)、圆形、条形、匙形、扇形、镰刀形、肾形、心形(包括倒心形)、提琴形、菱形、三角形和鳞形等。

从能否直接测量的角度看,叶片的形状特征可以分为直接特征和间接特征。叶片的直接形状特征是指可以从植物叶片的图像中直接得到的特征;而叶片的间接形状特征是指通过计算等方式得到的特征,它无法从植物叶片的图像中直接测量得到。

1.叶片的直接形状特征

常用的直接形状特征包括:叶片的周长(Perimeter)、面积(Area)、最小包围盒(Bounding-box)、纵轴长(Y-length)、横轴长(X-length)、凸包(Convex Hull)、外切圆(Ex-circle)、内切圆(In-circle)等。具体情况见图2-3。

图2-3 叶片形状特征示意图

(1)叶片的周长,一般来说,周长是指某一物体或区域的边界长度。叶片的周长就是叶片边缘的总长度。常用的计算周长方法有3种,它们分别为:链码法、隙码法和数边界点法。

①链码法,如果将图像中的像素看作点,叶片的周长就是计算出的链码长度。②隙码法,如果将像素看作单位面积的小方块,那么许许多多的小方块就组成了图像中的区域和背景,此时边界用隙码表示,叶片的周长就是计算出的隙码长度。③数边界点法,即用叶片轮廓像素的数目来计算叶片的周长。

这3种方法均以像素长度为单位,其中,链码法的测量精度相对较高,而隙码法和数边界点法的测量精度要低些,原因是像素在斜方向长度方面存在测量误差。所以,如果想让叶片周长的测量值接近其真实值,就应该使用链码法进行测量。

(2)叶片的面积,面积是对物体所占范围的一种客观度量,它由物体或区域的边界决定,与其内部灰度级的变化无关。计算叶片面积的方法有3种,它们分别是:边界链码法、像素计数法和边界坐标计算法。

①边界链码法,若区域的边界编码已知,则只需将值为1的行程长度累计相加,就能得到该区域的面积;若给出物体的封闭边界,则对应的连通区域的面积就是区域的外边界所包围的面积与内边界所包围的面积之差。②像素计数法,统计叶片边界和内部像素的总数,边界和内部像素点的总和与单个像素面积的乘积,即为叶片的面积。③边界坐标计算法,在平面上,一条封闭曲线所包围的面积由其轮廓积分来表示。

(3)最小包围盒(外接矩形),当物体的边界已知时,用其外接矩形的尺寸来表达它的基本形状是最简单的方法。

(4)纵轴长,最小包围盒的长度就是叶片的长度,或者指叶片轮廓上相距最远的两个像素点之间的连线。

(5)横轴长,最小包围盒的宽就是叶片的宽度,或者指与长轴垂直且距离最长的叶片轮廓上的两个像素点之间的连线。

(6)凸包,指包含叶片的最小凸集,它是最小的凸多边形,目标区域内的点都在这个多边形上,或者在其内部。

(7)外切圆,指与叶片外切的圆,即能包围叶片的最小圆;又指在目标区域里能够找到的以区域重心为圆心,以重心与轮廓的最大距离为半径的圆。

(8)内切圆,是与叶片内切的圆,即叶片能包含的最大圆。它是在目标区域里能够找到的以区域重心为圆心,并以重心与轮廓的最小距离作为半径的圆。

2.叶片的间接形状特征

常用的间接形状特征包括:纵横轴比(Aspect Ratio)、矩形度(Rectangularity)、面积凹凸比(Area Convexity)、圆周长凹凸比(Perimeter Convexity)、球型度(Sphericity)、圆形度(Circularity)、偏心率(Eccentricity)、形状因子(Form Factor)和最佳匹配椭圆(The Best Match Ellipse)。

(1)纵横轴比,是叶片最小包围盒的长和宽的比值。

(2)矩形度,图像的区域面积与其最小外接矩形的面积之比即为矩形度,它反映了区域对其最小外接矩形的充满程度。当区域为矩形时,矩形度为1;当区域为圆形时,矩形度为π/4;对于不规则的区域,矩形度介于0~1之间。

(3)面积凹凸比,是叶片面积与叶凸面积的比值。

(4)圆周长凹凸比,是叶片周长与叶凸包周长的比值。

(5)球型度,是叶片的内切圆半径与外切圆半径的比值,用来描述物体边界的复杂程度。

(6)圆形度,用来表示边界各点到叶片区域重心的平均距离与距离的均方差的比值。

(7)偏心率,是叶片长轴和短轴的比值。

(8)形状因子,是叶片面积和叶片周长平方值的比值。

(9)最佳匹配椭圆,是能够包围目标叶片图像的最小椭圆。

2.2.3 纹理特征

纹理的形成与灰度分布在空间位置上的反复出现有关,在图像空间中,有某种位置关系的两个像素间会存在一定的灰度关系,称为图像中灰度的空间相关特性。灰度直方图是对图像的单个像素进行某个灰度值的统计的结果,灰度共生矩阵是统计图像上有着特定方向和特定距离的两个像素分别具有的灰度状况并反映了图像变换的综合信息。灰度共生矩阵就反映了像素灰度相对位置的空间信息。灰度共生矩阵是一种通过研究图像灰度的空间相关特性从而描述图像纹理的方法,它将图像的灰度信息和之间的结构转化为量化的矩阵,即将纹理的识别过程转化成计算矩阵中的元素的过程,这样做处理起来很方便并且结果清晰。

灰度共生矩阵是图像像素的联合概率分布,也是纹理分析中常用的统计方法(Hassan M.,et al.,2012)。在图像的纹理特征中,灰度共生矩阵是研究图像纹理特征的一个有效方法,在图像分析、目标检测识别、生物学和医学等领域有着广泛应用。灰度共生矩阵的各个元素,由图像中两个位置上的像素组成的像素对应灰度级联合概率密度定义。灰度共生矩阵是建立在图像的二阶组合条件概率密度函数的基础上,即通过计算图像中特定方向和特定距离的两像素间从某一灰度过渡到另一灰度的概率,反映图像在方向、间隔、变化幅度及快慢等方面的综合信息。

(1)二阶矩

二阶矩反映了图像灰度分布的均匀程度和纹理粗细度。因为它是灰度共生矩阵各元素的平方和,又称为能量。二阶矩值大时纹理粗,能量大;反之,纹理细且能量小。

(2)对比度

对比度可理解为图像的清晰度。对比度大,纹理的沟纹深,图像清晰;反之则沟纹浅,图像模糊。

(3)相关

相关是用来衡量灰度共生矩阵元素在行或列方向上的相似程度。例如,水平走向纹理在水平方向上的相关就大于其他方向上的相关。

(4)熵

熵是图像所具有信息的度量,反映了图像中纹理的复杂程度或非均匀度。若图像没有任何纹理,则灰度共生矩阵几乎为零矩阵,熵值接近为零;若图像有较多的细小纹理,则灰度共生矩阵中的数值近似相等,则图像的熵值最大;若图像中分布着较少的纹理,则该图像的熵值较小。

(5)逆差矩

逆差矩可提取出图像旋转不变的特征,简单的方法是针对0°、45°、90°和135°角度下的同一特征求平均值和均方差。

纹理特征被广泛应用于图像识别和图像分类等领域。许多专家和学者都提出了不同的纹理特征提取方法,如灰度共生矩阵、自相关函数法和灰程长度法等;同时,专家和学者们也提出了许多新的纹理特征提取理论,如分形理论、马尔可夫随机场理论和小波理论等。本章从特征、模型和结构等方面总结了近年来纹理特征的提取方法和分类,包括几何方法、结构方法、模型方法和信号处理方法等。而基于叶片图像特征并融合观叶鉴定植物物种的方法,已被大多数专家和学者接受。

纹理特征的提取方法分为3类:统计方法、结构方法和频谱法。具体内容如下:

(1)统计法。在统计法中常用的有直方图法、灰度梯度法、自相关函数法和共生矩阵法。直方图法又分为窗口直方图法和边缘直方图法(林丰艳,2009)。

视觉系统所观察到的图像窗口中的纹理基元必然对应于一定概率分布的直方图,其间存在着一定的对应关系。根据这个特点,可以让计算机来开展两个大小相仿的图像窗口的纹理基元的计算和分析。边缘直方图方法就是沿着边缘走向像素的邻域分析其直方图。若某一范围内有尖峰,就说明在这个灰度范围内,纹理具有方向性。但是这种方法只能用来识别某些纹理。

灰度梯度矩阵法就是计算一个小区域的灰度梯度,找出其方向,然后将若干个小区域的方向加以综合,就可以找出该区域的纹理基元或纹理走向。

(2)结构分析法。结构分析法是从像素出发,检测出纹理基元,并找出纹理基元的排列信息,建立纹理基元模型。结构分析法运用形式语言来描述各种纹理单元及其排列规则,再通过语言的重新组织而形成所需的纹理模式。

(3)频谱法。借助Fourier频谱的频率特征来描述周期或近乎周期的二维图像模式的方向性。Fourier频谱中的尖峰对应纹理模式的主方向,这些峰在频域平面的位置对应模式的基本周期,一旦将周期性成分滤出后,剩下的非周期性部分就可用统计方法描述。

2.2.4 常用的叶片图像分类器

提取出植物叶片的特征后,需要根据其特征向量来进行识别。本章将详细介绍K最近邻(KNN)、K均值(K-means)、支持向量机(SVM)、人工神经网络(ANN)和移动中心超球分类器(MCH)等分类器。

2.2.4.1 KNN

KNN是模式识别领域中最常用的分类器。所谓K最近邻,就是K个最近的邻居的意思,说的是每个样本都可以用它最接近的K个邻居来代表。该分类器原理简单,操作容易,因此被广泛应用于分类和识别领域。它也是数据挖掘分类技术中最简单的方法之一。KNN算法的核心思想是,如果某一样本在特征空间中K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。KNN方法在决策时,只与极少量的相邻样本有关。由于KNN方法主要靠周围有限的邻近样本,而不是靠判别类域的方法来确定自己的所属类别,因此对于类域交叉或重叠较多的待分样本集来说,KNN方法较其他方法更为适合。

2.2.4.2 K-means

K-means算法是一种聚类算法,其基本思想如下所述:

首先,在输入的数据集中选择A个数据点作为初始聚类中心点。其次,扫描数据集中的所有数据点,计算每个数据点到这A个初始聚类中心点的距离。再次,选择距离最近的那个中心点,将该数据点归类到该中心点所在的聚类中。当所有数据点都扫描完毕后,更新各个聚类的中心点。最后,重复上述步骤并不断迭代,直到算法开始收敛。收敛的条件为达到预先设置的迭代次数,或者聚类中心点的变化不超过预先设定的阈值。这样的聚类将会使各聚类的内部数据点尽量相似,而不同的聚类之间则尽量不同。

2.2.4.3 SVM

SVM是Corinna Cortes和Vapn在1995年首次提出的一种模式识别算法,主要建立在统计理论的基础之上。SVM能够很好地解决如下问题:非线性和高维模式识别问题、小样本问题。SVM在刚提出时只适用于线性可分的类别,之后随着要求的提高,利用增加维度的方法将其应用到线性不可分和非线性函数等的情况中。SVM通过非线性变换将输入样本集映射到高维特征空间,从而改善样本集的分离状况。SVM主要应用于模式识别领域,用来解决小样本、非线性样本和高维样本等的模式识别问题。在二维平面上,可以通过最优分类线来正确分类线性可分的两类数据样本,同时使两类样本的分类间隔最大。对高维空间样本进行分类时,二维空间的分类线在髙维空间就演变成了分类面。SVM的非线性分类则由高维样本线性可分的最优分类面演变而来。

2.2.4.4 ANN

ANN是人类在对大脑神经网络认识和理解的基础上,人工构造的能够实现某种功能的神经网络。ANN在植物叶片识别领域中的应用很广泛,其基本思想是先得到植物叶片的形状、纹理和颜色等特征,然后将这些特征向量作为分类器的输入特征矢量,在经过网络训练后,对植物叶片进行分类识别。目前,主要应用在植物叶片识别上的人工神经网络分类器有BP神经网络、概率神经网络和自组织特征映射网络等几种。

BP神经网络分类器具有较好的自学习性、自适应性、鲁棒性和泛化性等特点。概率神经网络分类器是径向基网络的一个重要分支,其分类器是一种有监督的网络分类器,其优点是学习速度较快、收敛性好、网络结构设计灵活方便,比BP神经网络的识别率更高;然而在识别过程中,随着训练集中植物叶片种类的增加,其运算速度会减慢。自组织特征映射网络分类器是于1981年提出的一种由全连接的神经元阵列组成的自组织、自学习网络分类器,可以直接或间接地完成数据压缩、概念表示和分类等任务。多项实验表明,自组织特征映射网络分类器的识别率在90%以上。

2.2.4.5 MCH

移动中心超球分类器(Moving Center Hypersphere,MCH)是近年来新提出的一种分类器,它是一种对参考样本进行压缩的方法。其基本思想是用超球代表一簇点,对每种样本用若干个超球去逼近,并且移动超球的中心和努力扩大超球的半径,使它包含尽可能多的样本点,以便实现多个超球包含样本空间中的所有样本点。

有学者提取出叶片的形状特征后,利用MCH进行识别,在与其他分类器进行比较后,发现此分类器在识别时间和存储空间上更有优势。当叶片样本的数量和分类特征较多时,MCH通过对样本数据的压缩处理,可以有效减少存储空间和计算时间,但它的识别率比人工神经网络分类器要低一些(王晓峰等,2006)。在此基础上,有学者又提出了一种移动中值中心超球分类器(Move Median Center Hypersphere,MMCH),该方法在MCH分类器的基础上对判断准则做了改进,实验提取了15个植物叶片的特征去识别20种植物的叶片,结果表明,该方法在实际工作中是有效的(Du et al.,2007)。

2.2.4.6 遗传算法

遗传算法主要用在特征分类和特征选取领域,它的基本目的就是最优化遗传算法,能在不用计算梯度信息和权重初始化的情况下,高效得到接近最优化的连接权重。首先,采用某种编码方式将解空间映射到编码空间,使每个编码对应问题的一个解(称为个体或染色体);其次,随机确定初始的一群个体(称为种群)。在后续迭代过程中,按照适者生存原理,根据适应度的大小来挑选个体,并借助各种遗传算子对个体进行交叉和变异,生成代表新的解集的种群,该种群比前代更能适应环境,如此进化下去直到满足优化准则。遗传算法的主要优点是适应能力强,并且具有内在并行性。