1.2 研究现状概述
1.2.1 基于叶片图像的植物分类研究概述
对植物分类学的应用研究由来已久。植物叶片分类系统涉及多学科知识,包括计算机视觉识别技术、数学等,相关的研究包括植物叶片图像特征的提取算法、植物叶片图像特征分类器设计等,它是一项多学科高度交叉的综合性体系。虽然植物识别系统和植物叶片病害分类研究的起步相对较晚,但在不远的将来,肯定会成为植物及其病害识别和分类的主流方法。
一般而言,形态特征和纹理特征是植物叶片的主要分类特征。植物叶片特征的范围包括局部特征和全局特征。国外的相关研究始于20世纪80年代中期,有学者提取了叶片面积、周长、长度、宽度等17种简单的叶形特征,在定量描述的基础上,对其中的13个特征开展了定性描述并完成了对植物的测试(Guyer et al.,2000)。有学者研究了橡树的叶形,提取了27个叶片形状,并利用主成分分析(PCA)方法对橡树进行了分类(Ingrouille et al.,2006)。
有学者根据叶片的矩特征和几何特征,用BP神经网络作为分类器对15种瑞典树种进行了分类(Osikar et al.,1980)。有学者使用紧密度、圆度和叶片形状因子,以50个理想的叶子形状图形作为对照,来识别其他植物叶片的形状。实验结果表明,识别效果是有效的,这也为计算机识别植物种类打下了基础(Yonekawa et al.,1996)。有学者使用多角近似方法在两级叶片顶点上获得叶片轮廓。为了识别9种枫叶叶片的类型,不同叶片被分配到9种类型的最相似模板里。首先,对叶片开展归一化处理,保留原有的近似多边形,以提高叶形的识别率;其次,引入叶边锯齿的数目。对14株植物的实验结果表明,与以往方法相比,本次实验的效果有了明显改善,但对叶片种类的研究受到了限制(Cholhong et al.,1999)。有学者用70个样本中图像分形维数的方法,对叶片的复杂程度开展了估计和分析,为植物叶片分形理论的发展奠定了良好的基础(Bruno et al.,2008)。
相关研究在中国起步较晚。有学者对植物的自动分类技术开展了初步研究,描述了叶片的形状特征,并取得了一定成果(傅兴,陆汉清,1994)。有学者提出了基于计算机的植物叶片形状识别系统,该系统利用叶片形状特征,如长宽比、叶基部凹陷、叶裂缝,以及最宽处位置不同等特征对叶片形状进行自动识别该系统,该系统测试结果虽好,但不能对植物物种加以识别(朱静等,2005)。有学者对植物识别模型的特点进行了分析,论证了用图像处理和识别技术来自动提取植物的特征是可行的,但没有给出详细的实验结果(祁亨年等,2006)。
有学者利用自组织特征映射(BP)作为分类器,来识别15种植物的叶片,实验结果的平均精度较高。具体做法是:利用二维离散小波变换方法对图像进行分解,统计叶片图像在不同尺度下的小波系数中提取的72个纹理特征值,计算近似长宽比的8个叶片形状特点和7个叶片轮廓不变矩,得到了80个特征值。但是,由于叶片形状比较复杂,小波变换被用于叶片图像的分解时,其算法复杂且耗时(张蕾等,2006)。有学者利用叶片轮廓坐标来计算叶片矩形度、偏心度、圆度等7个不变矩和几何描述因子,同时引入了一个新的移动中心球分类器。这种分类器可以节省计算时间和存储空间,可以通过形状特征来对植物叶片快速开展分类和鉴定(王晓峰等,2008)。有学者利用叶片的8个形状特征,通过神经网络分类器来分类,得到了较高的识别率(侯铜等,2009)。有学者通过提取叶裂数、叶裂程度和叶片排列方式等特征对叶片轮廓进行分析,得到了6个精确阈值来对叶片进行分类。这表明,叶裂特征可以用来识别植物的种类(张静等,2008)。
1.2.2 基于叶片图像的植物病害识别研究概述
由于绝大多数植物病害症状会在植物叶片上表现出来,使植物叶片的颜色、形状和纹理发生变化,因此病害叶片症状是发现病害和判断病害种类的主要依据之一。特征有效选择、病害准确分割和病害有效诊断是农作物病害识别的关键技术。近年来,国内外研究人员对植物叶片病害的识别方法开展了广泛研究,通过对植物病害叶片图像开展增强、分割等预处理方式,提取病害叶片的统计分类特征,再利用支持向量机(SVM)等分类器达到智能识别的目的。
有学者利用遗传算法(GA)优化神经网络(NN)的结构和参数,以提高病害叶片的分类效率(Sammany et al.,2007)。有学者通过对棉花病害叶片的图像进行增强、分割和特征提取,并结合支持向量机来识别棉花病害,取得了较好的效果(Camargo et al.,2009)。有学者利用朴素贝叶斯分类器和NN分类器对玉米病斑图像开展分类,病害识别率达83%以上(王克如等,2003)。有学者采用SVM对不同受害程度的小麦病害叶片的图像进行识别,识别率高达97%(王海光等,2008)。
有学者综合运用数字图像处理技术来提取玉米病害叶片图像的特征向量,并采用GA和Fisher判别分析法来识别玉米叶部病害,识别率达90%以上(王娜等,2009)。有学者利用叶片图像的颜色统计特征,对黄瓜不同时期的炭疽病和褐斑病进行了分类和识别(岑喆鑫等,2007)。有学者综合运用图像处理和NN等方法,研究了黄瓜叶部病害的识别方法(王树文等,2004)。有学者对黄瓜霜霉病叶片的受害程度进行了识别研究(施伟民等,2012)。
有学者结合颜色、形状、纹理等外部特征,在农业病害领域应用图像处理和模式识别技术来识别农业植物的病害,不但可以得到病害叶片的图像,而且可以给用户实时传输病害的种类、程度和防治方法等信息,因此说这是一项有效的农作物快速诊断病害方法(邵陆寿,葛婧等,2007;戴之祥,邵陆寿等,2007;马德贵,邵陆寿等,2008)。有学者构建了一个基于病斑图像处理的病害诊断系统,其自动化程度高(刘君等,2012)。
目前,国内外研究人员研究农作物病害的方法,可以分为两种:(1)利用遥感图像技术,如使用高光谱成像技术来实现对温室黄瓜病害的分类,(2)以往为大多数研究人员所使用的图像处理技术。
目前,国内外研究人员对植物病害的研究主要集中在图像分割、图像特征提取和病害识别等方面,他们在农作物病害智能诊断方面做了大量工作。有学者认为,植物受病害感染后,其代谢功能将会受到影响,从而导致植物的外部形态和细胞出现变化,也可能会引起植物全身出现症状。虽然症状多种多样,但大多数会通过叶片的纹理、颜色和形状表现出来。然而,对于不同类型的致病性病原体,叶片所表现出来的病害的图案、颜色和形状也是不同的,因此可以根据病害的特征来识别它们(王克如等,2005)。
1.2.2.1 基于颜色特征的植物病害识别
Ahmad等通过彩色图像信息实验得出,在无氮缺水的情况下,玉米叶片的颜色会发生变化,这可为农民进行灌溉和施氮肥做参考。有学者在蘑菇叶病害诊断分析的基础上,使用RGB颜色空间模型的两个柱状图,研究蘑菇叶片在正常情况下和病理情况下的两种特征颜色。通过计算机视觉分析技术来诊断蘑菇叶片是否缺少钙、铁和镁等营养元素(穗波信雄,1989)。有学者提取了番茄营养缺乏病3种颜色特征值的均值,即标准差、方差和3种颜色RGB值之间的相关系特征,以此来识别缺乏营养的番茄叶片(徐贵力等,2003)。有学者在识别辣椒黄斑疾病时,利用中值滤波前的预处理手段来提取纹理特征,以及使用双峰法,有效地区分了正常叶片和病理叶片(崔艳丽等,2005)。在利用神经网络技术识别斑点区域的研究工作中,有学者根据大豆叶片斑图的RGB颜色特征进行了实验并验证了该技术的有效性(马晓丹等,2006)。
1.2.2.2 基于纹理特征的植物病害识别
纹理一般是图像中由灰度分布在空间位置上反复出现而形成的。灰度共生矩阵是由Haralick提出的一种用来分析图像纹理特征的重要方法,它建立在图像的二阶组合条件概率密度函数的基础上,即通过计算图像中特定方向和特定距离的两像素间从某一灰度过渡到另一灰度的概率,反映图像在方向、间隔和变化幅度等方面的信息。灰度共生矩阵是常用的纹理统计分析方法之一。
有学者提取了红辣椒斑点病斑的均匀性、惯性矩、能量和熵的共生矩阵纹理特征,是识别该病害的较好参数(张静等,2006)。有学者对玉米病害开展分类鉴定的方法是通过提取玉米叶片病害的Haar小波特征。从玉米叶片的纹理特征等方面提取玉米叶片的特征向量,再将输入空间的样本,映射到高维特征空间的K均值聚类上,用来识别玉米叶片的病害(宋凯等,2007)。有学者利用该方法对玉米、葡萄等植物的病害进行了鉴定(田有文等,2010)。
1.2.2.3 基于形状特征的植物病害识别
有学者对黄瓜炭疽热的自动诊断方法开展了研究,从形状特征和光谱反射特性的角度,利用遗传算法建立了识别参数,并确定了该病害的识别特征(Yuataka Sasaki et al.,1999)。有学者通过对两种孢子植物的主成分进行分析,从图像中得到了芽孢和其他孢子的形状特征,并得到了孢子的表面积、周长、半径、脊的数量和凸起参数(如大小和圆度)(Chesmore et al.,2003)。有学者利用图像相似度测度和用户相关反馈技术,提取了相关植物叶片矩形区域的形状特征,并开发了图像检索系统(李峥嵘等,2007)。
1.2.2.4 基于光谱特征的植物病害识别
利用数字红外热成像技术,有学者研究了采用多光谱成像技术提取受感染的辣椒叶片表面的多光谱图像,并取得了成效;利用了叶片的高光谱图像采集系统,对白粉病、黄瓜霜霉病等病害的高光谱图像数据进行了研究;利用了450~900nm范围特征波长的图像,提取出了黄瓜叶片的特征向量,对黄瓜病害的诊断率达到了98%(冯杰等,2002)。有学者研究了黄瓜叶片在蒸腾作用下所受的霜霉病的影响,结果表明,由于气孔开孔的异常,感染后的叶片温度比未受感染时下降了0.8℃。由于细胞膜不再完整,导致大量受到病毒感染的细胞组织损失殆尽,叶片出现了萎黄病的相关症状。通过对小麦冠层光谱中受麦二叉蚜攻击的特征谱分析,有学者发现在694nm光谱反射率中,植被指数的光谱中心在800nm和694nm组合的光谱中可以检测到该病害(Miriam et al.,2004)。
1.2.2.5 其他植物病害的识别方法
有学者利用穷举搜索法和颜色共生矩阵来得到叶片的纹理特征,并在高斯分类器的帮助下得到了最优的特征参数(Burks et al.,2000)。有学者利用时域差分算子提取了叶片的纹理特征(毛罕平等,2003)。有学者通过模糊BP神经网络模型,对26种葡萄的常见病害进行了诊断,得到了模糊隶属度的表达方法(刘树文等,2006)。有学者利用区域标记法、阈值法,并结合Freeman链码法,根据具有代表性病灶的玉米叶片的图像特征对玉米叶部的疾病进行了识别(赵玉霞等,2007)。有学者采用遗传算法得到了玉米叶片病害的特征,如纹理、颜色和形状等,实现了鉴定玉米叶片病害的目标(王娜等,2009)。
根据上述研究,植物病害的纹理特征通常采用共生矩阵等方法获得,但仅用单一特征会影响植物病害的识别率。植物病害的颜色特征常常是以RGB为主,有较为明显的缺点——不但识别率不高而且算法运行时间长。形状特征的提取最为直接,虽然植物病斑的形状不规则,但是一般情况下分析几个常用的特征就能得到较理想的结果。基于遥感图像处理技术的植物病害识别方法对设备的要求很严格,例如,要用到红外摄像机或光谱仪设备。但是,这些设备的价格往往较为昂贵,不利于推广和使用。
1.2.3 深度学习在植物种类及病害识别领域的研究概述
由前两节可知,国内外很多专家和学者都致力于利用数字图像处理技术来识别植物的种类和病害。植物的基本特征包括叶片的形状特征和纹理特征,而对特征的描述范围又分为全局与局部。随着数字图像处理技术的发展,对植物叶片加以识别的算法也变得多种多样,可分为以下3类:(1)基于关系结构匹配的植物叶片识别方法;(2)基于统计的植物叶片识别方法;(3)基于机器学习的植物叶片识别方法。
尽管植物分类方法取得了非常大的进展,但在研究过程中仍存在许多问题。以往的植物叶片分类方法,一般采用两步法:(1)从输入的图像中提取叶片的特征;(2)根据特征,利用训练分类器开展数据分类。该方法的效果在很大程度上取决于人们的选择是否合理,但他们在选择特征时往往会感到盲目。虽然现在按人工设定的特性分类也有非常好的效果,但这些特性都是针对特定的数据而设计的。当使用相同的特性来处理不同的数据集时,得到的结果可能会不同,因此该特性是不可迁移的。
近年来,深度学习引起了国内外学者浓厚的研究兴趣,并在计算机视觉、图像分类与识别、目标检测和语音识别等众多领域取得了突破性进展。深度学习是机器学习研究的一个新领域,目的是建立和模拟人脑的分析和学习的神经网络,以及模拟人脑解释数据的机制。作为无监督学习的一种,深度学习采用了神经网络的层次结构,包括输入层、隐层(多层)、多层网络输出层,它们只存在相邻节点之间的连接,在同一层和跨层节点之间不存在相互连接。深度学习建立了与人脑相似的层次模型结构,对输入数据逐层抽取,建立了从底层信号到高级语义的良好映射关系。
谷歌、百度和阿里巴巴等公司近年来投入了大量资源来研发深度学习技术,并取得了重大进展,例如在语音、图像和在线广告等领域。从实际应用的效果来看,深度学习可能是近10年来机器学习领域最成功的研究。深度学习模型不仅避免了提取图像特征时比较耗时的问题,而且大大提高了图像识别的精度,提高了在线操作的效率。
近年来,很多学者从深度学习的模型设计、训练方式、参数初始化、激活函数选择和实际应用等多个方面进行研究,提出了很多深度学习模型,例如卷积神经网络(CNN)、深度波尔茨曼机(DBM)、深度置信网络(DBN)等,并成功应用于图像识别和植物病害识别中。由于CNN能够直接输入原始图像,现已被广泛应用于计算机视觉和图像识别与分类等领域。CNN是一项将人工神经网络与模拟视觉系统、深度学习技术相结合的新方法,在图像识别领域有着广泛的应用。卷积神经网络具有局部感知的区域性、层次性、特征提取与分类相结合的全局训练等特征,其优点是,不仅更接近于生物学,而且降低了网络模型的复杂度,减少了权值的数量。在处理多维图像时,该模型的优势更加明显。作为一项专门用于二维形状识别的多层感知器,卷积神经网络对图像的平移、缩放、倾斜等处理不会引起图像的变形。