基于神经网络的监督和半监督学习方法与遥感图像智能解译
上QQ阅读APP看本书,新人免费读10天
设备和账号都新为新人

第1章 概述

机器学习(Machine Learning)是研究如何使计算机程序随着经验积累自动提高性能的一门学科,其目标是使计算机程序利用样本数据或以往的经验来解决给定的问题[1]。它是人工智能(Artificial Intelligence)的一个核心领域,并已经成为整个计算机领域中最活跃、应用潜力最明显的领域之一。机器学习在解决传统的语音辨识、手写汉字以及人脸识别等问题之余,还被广泛应用于包括遥感图像智能分类、数据库知识挖掘问题、自然语言处理问题、机器人控制问题等在内的许多新问题[2,3]。而神经网络以其自组织性、自学习性、并行性、容错性、高度非线性、高度鲁棒性、对任意函数的任意精度逼近能力和不透明映射性能,成为机器学习领域最热的焦点,可以说神经网络是机器学习研究、开发和应用最为活跃的分支之一。

根据输入的训练样本中包含的经验情况,机器学习可分为监督学习(Supervised Learning)、无监督学习(Unsupervised Learning)和半监督学习(Semi-Supervised Learning)。其中监督学习是最常见的机器学习方法,也是训练神经网络常使用的一项技术,监督学习过程中所使用的样本均是有标记的(Labeled),这里的“标记”(Label)是指样本具有与输入明确对应的输出。神经网络依赖于这些确定的标记信息判断网络的误差,然后据此调整网络权值以达到适应系统的目的。随着数据收集和存储技术的飞速发展,未标记(Unlabeled)样本的收集已变得相当容易,而有标记样本的获取仍相对较为困难。例如,遥感图像类标的获取通常需要实地考察和通过经验进行目视解译来对样本进行标记,因此往往需要大量的人力和物力[4]。无监督学习虽然不需要标记样本,但是缺乏先验知识的有效引导,模型的准确性难以保证。此外,只使用少量的有标记样本所训练出的神经网络往往泛化能力不强,而且仅对少量有标记样本加以利用,而忽略大量未标记样本,是对数据资源的极大浪费。因此,在有标记样本较少时,利用大量的未标记样本来改善学习性能的半监督学习已成为当前机器学习研究中备受瞩目的内容之一。在半监督学习中,采用神经网络作为学习器有助于提升半监督学习方法的自适应调节能力,并降低其对先验知识的依赖程度[5]

本书从监督学习方法、半监督学习方法和神经网络的基本概念出发,分析当前实际问题的需要,以神经网络作为基础,以监督学习和半监督学习方法为工具,介绍基于神经网络的监督和半监督学习的最新理论研究成果,并着重介绍其在遥感解译领域的应用实例,试图为机器学习和遥感图像解译研究领域引入新思路和新方法。