1.1 数字高程模型
1.1.1 数字高程模型的基本概念
数字地形模型(Digital Terrain Model,DTM)通常是地形表面形态属性信息的数学表达,定义为:“描述各种特性空间分布的有序数值阵列,在最通常的情况下,所记录的地面特性是高程z,它们的空间分布可以由x、y水平坐标系统描述,也可以由经度、纬度描述海拔h的分布。”可以用式(1.1)所示的二维函数的系列取值的有序集合概括表示数字地形模型的丰富内容和多种形式(柯正谊等,1993)。
式中,Kp为第p 号地面点(一般为单点或者其微小邻域所划定的范围)上的第k类特性信息的取值;(up,vp)为第p号地面点的二维坐标,可以采用任意地图投影下的平面坐标,或者经纬度坐标,或者矩阵的行列号;m (m≥1)为特性信息类型的数目;n为地面点的个数。
当m=1且 f1表示地形表面高程的映射时,式(1.1)所表达的数字地形模型就是数字高程模型(Digital Elevation Model,DEM)。
从数学意义上来说,数字高程模型是指定义在二维空间上的连续函数H=f (x,y)。由于连续函数的无限性,DEM表现为将有限的采样点使用某种规则连接成一系列的曲面片或平面片来逼近原始曲面(汤国安等,2005)。因此DEM的数学定义为区域D内的采样点Pj按照某种规则ξ连接成的面片M 的集合DEM:
连接规则ξ构成DEM的数据结构,可以是呈规则分布的格网或不规则分布的格网。
当ξ为正方形格网时,DEM称为基于规则格网的DEM。由于正方形格网的规则性,格网点的平面位置(x,y)隐含在格网的行列号(i,j)当中,因此DEM相当于一个n行m列的高程矩阵GDEM:
当ξ为三角形网格时,DEM表现为使用互不交叉、互不重叠的,连接在一起的三角形网络逼近的表面,称为基于不规则三角网(Triangulated Irregular Network,TIN)的DEM。基于不规则三角网的DEM表示为三角形T 的集合TD EM:
式中,τ是三角剖分准则;Pj、Pl、Pk是空间离散点。
一般将地形表面看作一个单值曲面。也就是说,模型中的任意一点都是唯一的,并且相同的x、y仅对应一个z值,严格来讲,这样的模型是2.5维模型。数字地形模型中的“数字”主要用来强调与其他非数字表达形式的地形模型之间的区别,如纸质地图表示的晕渲图、等高线图等。随着计算机的广泛应用和数字地形模型研究的发展,人们更应该强调数字地形模型是一个三维的模型,而不应该强调它是以属性形式表达的模型。因此,将数字地形模型称为“三维地形模型”更合理(王光霞,2005)。
1.1.2 DEM误差及其来源与分类
误差是指观测数据与其真值之间的差异。不管采用何种测量方法,测量数据总会包含各种各样的误差。根据误差的性质可以将其分为系统误差、随机误差和粗差。
系统误差由数据采集设备引起,表现为常数或函数特征,通过对采样数据施加改正数或遵循工艺流程可以将其影响降到最低。
随机误差由数据采集过程中的不确定性因素引起,毫无表现规律可言。但是,随机误差服从统计规律,单个误差的大小并无实际意义。
粗差是在操作过程中由于粗心或不遵守规定引起的,实际上是一种错误,必须将其剔除。因此,DEM数据生产流程必须统筹规划,以利于粗差的检测和剔除。
对于DEM误差而言,当原始数据中的粗差剔除后,严格检验校正数据采集仪器,并遵守操作规定,那么系统误差将处于次要地位。因此,大多数学者认为DEM误差属于随机误差。
许多学者对DEM误差的来源与分类提出了不同的看法。
汤国安等(2005)认为,对DEM误差的分析和研究,不但需要研究高程数据误差,还需要研究逼近误差,因此将DEM误差分为数据误差和描述误差。数据误差是DEM数据源误差和由插值引起的高程数据误差;描述误差是DEM对地形表达的误差,包括地形特征、尺度、DEM结构和采样点分布方式等产生的误差。
Fisher等(2006)提出的DEM误差来源与汤国安等(2005)一致;但是,在DEM误差分类方面,Fisher等(2006)将DEM数据源误差和由插值引起的误差分别当作两种不同的误差来源。
胡鹏(2007)认为,从DEM生产流程考虑,DEM误差来源可以明确分为两个过程:一是在测量和绘图过程中产生的误差;二是在测绘数据上构造插值函数所产生的逼近误差。胡鹏(2007)还认为,两者所产生的误差的度量方法是明确的。
王光霞(2005)同样认为DEM误差主要存在两种形式:一种是对实际地形表面采样所引起的误差,即原始数据误差;另一种是由数据重采样引起的误差,即由DEM插值算法引起的插值误差。
本书倾向于将DEM误差归结为数据源误差和由插值算法产生的插值误差。
数据源误差表现为系统误差和随机误差,它们由各种不同的插值算法传播到DEM误差中,形成DEM误差的一部分。这部分误差可以使用“样本采样计算,用实地高精度测量样本‘真值’检核,十分明确,规范齐全”(胡鹏,2007)。
插值误差表现为逼近误差或描述误差,由插值算法本身产生。同时,插值误差也受地貌类型、采样点分布方式与密度、格网尺寸(尺度)等外在因素的影响。这些因素通过插值算法最终影响DEM插值误差。
1.1.3 DEM精度模型
DEM精度模型主要探讨影响DEM精度的各种因素,并且使用各种定性、定量和可视化方法加以描述,从而控制DEM的质量。它的研究内容主要包括DEM误差来源与分类、DEM粗差的探测、DEM精度指标、DEM误差模型、DEM误差可视化、DEM误差的减少和修正、DEM插值算法评价、DEM误差的空间结构等(卢华兴,2008)。
中误差(Root Mean Square Error,RMSE)是传统的DEM精度评价指标。国家测绘地理信息局和美国地质勘探局(United States Geological Survey,USGS)采用28个高精度的随机参考点,计算28个检查点的RMSE来评价整幅DEM的精度;英国地形测量局(Ordance Survey,OS)也采用RMSE指标。但是,RMSE并不能反映单个误差的大小,它从整体意义上描述地形参数和真值的离散程度(刘学军,2002)。RMSE的前提假设是误差的随机性,即服从均值为零的正态随机分布;但是不能解释误差中的系统成分,即平均误差一般不为零(Li,1988;Fisher,1998)。因此,有学者为了满足特定应用,尝试采用不同的DEM精度指标,如标准差、相对中误差、对数中误差、精度比率等。刘学军(2002)对常用的DEM数值精度指标进行了归纳总结(见表1-1)。
表1-1 常用的DEM数值精度指标
注:Z为地形参数的真值,z为观测值或计算值,ε=z-Z为误差,n为误差个数。
本书仍然使用中误差作为DEM精度的度量指标。
1.1.4 DEM精度影响因素
李志林和朱庆(2003)认为,影响DEM精度的主要因素包括地形表面的粗糙度、插值算法,以及原始数据的精度、密度和分布等。因此,DEM精度的数学模型可以写为
式中,Ac表示DEM的精度,S表示DEM结构特征,M 表示DEM插值算法,R表示地形特征,A、Ds、Dn分别表示DEM原始数据的3个属性(精度、分布、密度),O表示其他因素。
DEM误差是DEM插值过程中传播的各种误差的综合。
其中,地形特征(或者地貌类型)决定了地形表达的难度,因而在影响DEM精度的各种因素中扮演了重要角色。DEM可以通过两种方法建立:一是直接以量测数据建立,二是通过从随机点到格网点的插值处理以间接的方式建立。从随机点到格网点的插值处理对原始数据中表现出来的空间变化具有一定的综合作用,而直接建模方式可以有效避免因插值带来的地形表达可信度的损失。
毋庸置疑,原始数据的误差肯定会通过插值过程传递到最终的DEM表面。原始数据的误差可以使用中误差、方差和协方差的形式来表达。如果每个格网点的量测被认为是独立的,则协方差可以忽略。
原始数据的分布特征(包括分布方式和密度)是影响DEM精度的另一个主要因素。
DEM的结构特征是决定DEM表面和地形表面相互吻合程度的因素,因而也就决定了DEM的表面精度。DEM表面既可以是连续的,也可以是不连续的,还可以是光滑的或不光滑的。
Heritage等(2009)认为,DEM质量在很大程度上是原始数据精度(Accuracy of Individual Survey Points)、采样策略(Field Survey Strategy)和插值算法(Method of Interpolation)的函数。与李志林、朱庆(2003)的观点相比,Heritage等(2009)将地貌类型、采样数据的分布和密度归纳为采样策略。这是有道理的。因为每个区域的地貌类型差异是“存在”的,是不以人的意志为转移的;在插值过程中,地貌类型的差异只有通过采样数据的差异明确体现时,地貌类型才存在“实在”意义。
结合李志林和朱庆(2003)与Heritage等(2009)的观点,可以认为影响DEM精度的主要因素包括原始数据精度、插值算法、地貌类型、采样数据分布特征和DEM结构等。
1.1.5 DEM插值算法
DEM表面建模和DEM插值存在一些细微的差别。DEM插值包括估计新点高程的整个过程,这个新点可能随后被用于表面重建。DEM表面建模强调重建表面的实际过程,这个过程或许并不包含插值计算,因此表面建模只涉及“如何重建表面,以及哪类表面将被重建”的问题。
因此,DEM插值包含比DEM表面建模更为广泛的内容,它可能包含了表面重建及从重建表面提取高程信息的过程,也可能包含了根据随机分布点或从规则格网中获取的高程量测值生成等高线的过程。因此,本书使用DEM插值的概念。
DEM插值是DEM的核心问题,它贯穿于DEM的生产、质量控制、精度评定、分析应用等多个环节(李志林和朱庆,2003)。20世纪70年代以来,许多学者提出了一系列DEM插值算法,包括多项式插值算法、多面函数插值算法、径向基函数插值算法、最小二乘配置插值算法、克里格插值算法、加权平均插值算法、三角线性剖分插值算法、数学形态学插值算法等。不同的插值算法具有不同的优点和不足,因此DEM插值算法的研究具有现实意义。