1.3 主要植物叶片数据集介绍
在研究植物叶片分类及其病虫害识别方法的过程中,研究者们分别建立了一些不同的数据集,包括瑞典植物叶片数据集、ICL植物叶片数据集、Flaria植物叶片数据集等。下面我们对这些数据集分别进行简要介绍。
1.3.1 瑞典植物叶片数据集
瑞典植物叶片数据集(Swedish Leaf Database)(1)包含15类叶片图像(见表1-1),每类75幅。
表1-1 瑞典植物叶片数据集中的15类植物名称
这个数据集有几个明显的特性:(1)图像中的叶片是手动对齐的,并且只有非常小角度的旋转。(2)只有同一侧的叶子被捕获。但事实上,叶子的两边形状通常是不同的。(3)叶片质量好,无严重的局部损失。由于数据集具有上述3个特性,因此数据集有一个很大的空间布局,其蕴含的空间信息可以用来提高图像的分类精度。值得注意的是,在实际中这样的先验条件是不存在的。
1.3.2 ICL植物叶片数据集
ICL植物叶片数据集(Intelligent Computing Laboratory Leaf Database)(2)。在该数据集中,图像均由智能计算机实验室的成员在合肥植物园收集得到。目前,在该数据集中的样本有220个类别,每类包含26~1078个叶片样本。
1.3.3 Flaria植物叶片数据集
Flaria植物叶片数据集(Flaria Leaf Database)(3)(见表1-2)包含33类植物的1907个RGB叶片图像,每个品种都有40~60个样本叶片,它们大部分都是来自中国长江三角洲的常见植物。
表1-2 Flaria数据集
续表
1.3.4 Cleared植物叶片数据集
Cleared植物叶片数据集(4)是一个在线采集树叶的图像集,由来自世界各地实验室的不同人员参与收集。其目的是便于在叶片的结构和功能方面开展研究,保存和归档植物叶片的数据,促进学术交流。
1.3.5 叶片形状数据集
叶片形状数据集(5)由印度学者和研究人员开发,是为了纯学术交流和研究而开发的,对于评估各种图像的处理算法非常有用,目前由18种不同类型的叶片图像组成。
1.3.6 ImageCLEF
ImageCLEF(Cross Language Evaluation Forum)旨在提供一个跨语言标注和检索图像的评价论坛。2012年,其所采用的数据集包括了126种来自法国地中海地区的植物,总共11572个样本。
1.3.7 MEW数据集
MEW(Middle European Woody)数据集是基于叶片形状的植物种类识别的实验而创建的,它主要包含生长在捷克共和国的乔木和灌木叶片。MEW 2014有200个种类,每个种类包含4~168个样本,总共包含15074个叶片样本。
1.3.8 PlantVillage植物病害叶片数据集
PlantVillage是一个关于植物及其健康的在线平台,可以提问和回答关于农业和植物方面的问题。平台发布了一个含有正常和病害植物叶片图像的数据集(6),包含14种植物共54309个图像。在植物病害叶片数据集中,包含了26种常见疾病。