
2.2 大庆市景观动态数据来源与处理方法
2.2.1 基础资料采集
当代科研中数据源是多种多样的,有遥感影像和航空照片等对地观测数据,又有地面定位、半定位观测数据、野外调查数据以及各种统计数据,本书使用的基础数据主要有:
(1)图形图像资料:1988年、1996年和2013年TM遥感影像;大庆市1∶50000地形图(1987年);大庆市1∶39000土地利用现状图(1987年、1996年、2013年)。
(2)文字图表资料:大庆市1988—2013年统计年鉴,大庆市社会经济统计资料,大庆市志,大庆市城市建设统计资料,大庆市城市总体规划文本说明,大庆市生态建设规划文本说明,INTERNET检索资料等。
(3)实地调查和专家访谈:实地调查可以验证基础资料并补充基础资料的不足,专家访谈有助于对资料的掌握、解释和理解,了解当地城市发展问题并为城市景观分类提供依据。
2.2.2 遥感数据的处理
1.遥感数据的选择
根据遥感影像的自身特点、研究所需时间段以及经济条件等方面的考虑,本书进行的景观格局变化研究的基础资料见表2-17。遥感影像的几何纠正和行政界限、地貌资料的提取,采用了1∶50000的1987年地形图。遥感影像解译过程中,进行野外训练区的选取,并参考了土地利用现状资料和社会经济统计资料。
表2-17 大庆土地利用遥感原始数据一览表

美国陆地卫星(Landsat)系列是指地球资源卫星,携带了多光谱扫描仪MSS和专题制图扫描仪TM两种主题成像传感器,两种传感器都是采用扫描镜进行机械扫描的方式。Landsat的轨道为太阳同步的极地圆形轨道,保证北半球中纬度地区获得中等太阳高度角的上午影像,且卫星通过某一地点的地方时相同。每16至18天覆盖地球一次(重复覆盖周期),图像的覆盖范围为185×185km2(Landsat-7为185×170km2)。MSS数据有4个波段,空间分辨率80m。TM图像包含7个波段,除第6波段的空间分辨率为120m外,其余6个波段为30m,包含三个可见光波段分别为蓝(B1)、绿(B2)、红(B3),1个近红外波段(B4),两个短波红外波段(B5、B7)和一个热红外波段(B6),信息量丰富,是当今进行遥感研究土地利用及景观格局分析的常用遥感数据[39][40]。
本研究采用了由波段4、5、3组成的假彩色影像,所使用的卫星遥感数据为1988年、1996年和2013年三个时期的TM影像。与NOAA、MSS相比,TM具有更好的几何保真度,更高的辐射准确度和较高的空间分辨率,以及较长时间的历史记录和较大范围的空间覆盖[39]。其波段设置和分辨率情况见表2-18。
表2-18 Landsat-4、5影像技术参数

2.遥感影像处理流程
本书应用ERDAS IMAGE 8.6遥感影像处理系统,对大庆市1988年、1996年和2013年的TM影像进行处理,获得了三个时期的大庆城市景观类型图。
(1)波段合成
原始的TM遥感影像由7个单波段组成,相对独立为单色影像。这种影像不仅目视效果差,而且信息分散,难以综合。采用彩色合成技术,可以把多个波段的黑白影像再叠置成一张彩色影像,这样能使目视效果大大改观,对解译地物极为有利。利用ERDAS>: Interpreter→Utilities→Layer Stack合成彩色TM影像[41]。在土地利用/覆被类型的研究中采用4、5和3波段的合成方案。这是因为叶绿素在4波段上反映强烈,5波段对植物的水分较为敏感,3波段则能较好地分辨无植被覆盖的地物。4、3、2波段为标准假彩色合成图像,其中2波段适合植被的绿反射峰测量研究和水体污染监测。但与其相比,4、5、3波段的合成方案更适合城市景观类型研究(如图2-7所示),因为这三个波段包含的独立信息很多,色彩反差明显,层次丰富,能使图像解译更为精细[42]。

图2-7 TM影像453波段与432波段合成比较
(2)几何校正
遥感图像由于卫星的姿态、轨道、地球的运动和形状等外部因素及遥感器本身结构性能和扫描镜的不规则运动、监测器采样延迟、探测器的配置、波段间的配准失调等内部因素引起图像上像元的几何畸变。系统性的几何畸变是有规律并可以预测的,如扫描畸变等;非系统性的几何畸变是没有规律的,难以预测,如遥感平台的高度、经纬度、速度和姿态等的不稳定[43-45]。
几何校正的目的是要纠正这些系统与非系统因素引起的图像变形,从而实现与标准图像或者地图的几何整合[46]。本书几何校正的目的,是改正原始图像的几何变形,使得遥感图像的投影方式与地形图的投影方式(Albers投影)一致。
本书选用完成数字化的1∶50000地形图作为影像和图件的控制数据,该矢量化数据的投影为阿尔伯斯投影,采用全国统一的中央经线和标准纬线,中央经线为105°,双标准纬线分别为25°和47°,椭球体为Krasovsky椭球体。以2013年TM影像作为栅格——矢量校正的初级数据,通过ERDAS>:Raster→Geometry correction进行几何校正。控制点选取,采用二项式几何纠正方法。该方法的基本思想是利用影像与地形图的同名地物点对,通过最小二次乘法求解多项式,得到纠正系数。一般公式为

式中,x, y为像元在影像中的坐标,X, Y为在地形图中的坐标,多项式展开式为

式中,a, b为几何校正系数,n为多项式次数。
选取控制点时尽量在堤坝、公路和水渠的交汇处。而且,控制点标准误差控制在2~3,像元误差控制在0.5个以内。再通过Geometry>:image→image进行两幅图像配准。
(3)遥感影像解译
遥感影像解译是从遥感图像上获取目标地物信息的过程,遥感影像解译分为人工目视解译和计算机解译两种。人工目视解译是一种传统方式,可充分利用判读人员的知识提取空间相关信息,但花费时间多,并存在个人差异;由于技术、数据源、模型等多方面的因素,景观类型的计算机解译在当前面临许多困难,精度难以保证。基于这种情况,本研究的城市景观类型数据解译工作采用计算机自动非监督分类方法自动分出50级,这样就可以大大减少人为勾勒景观类型边界所产生的误差,再人机交互目视解译1988年、1996年和2013年大庆市城市景观类型。
正确地选择合适方法来解译遥感影像是城市景观提取的关键:一方面取决于使用的数据源的质量;另一方面也取决于动态监测的目的。由于要获得多种类型的变化信息以及变化的数量、位置等信息。因此在对5个时段的影像解译过程中,采用了混合和分类比较相结合的方法。
计算机进行图像处理时,时间短且可重复提取出物理量及指标,但较难利用人的知识,以至于不擅长提取空间相关信息;人工目视解译可充分利用判读人员的知识擅长提取空间相关信息,但花费时间多,并存在个人差异,因此在本研究中将两者结合起来人机交互全数字化方式的技术路线。利用GIS软件的ArcGIS提供的观察图形、图像的工具在ArcWorkspace中运用Edit Tools工具将已经过几何精纠正的影像数据以BACK ENI方式打开,据影像特征:①图像上不同色调表现出的地物空间的特征:②根据性状、大小,图形、阴影、位置、纹理、类型等判读特征,解译出耕地、草地、林地、水城,未利用地、居民及工矿用地等6类。将解译的结果打印输出,再进行野外校核与线路验证来检验判读解译的准确性和外推准确性。同时还要对解译不太清楚的地方重新进行实地勘察。在调查中充分发挥RS、GPS与GIS(3S)相结合的集成功能对定位、定量、定性、定时分析与调查结果进行详细记录,测量和记录了各种林带的度,用于线状地物的提取、林地面积的量算和从耕地中扣除线状地物等。实地考察是在2013年9月中下旬进行的。共计定点354个,拍摄照片200余张,对解译结果进行了补充、修改,以确保解译结果的精度。最后由专家对判读精度进行评判,并提出校核意见,根据专家意见对解译结果进行全面修改,最后完成判读解译工作。
2.2.3 网格数据的建立
1.数据格网化原则
在进行数据格网化时,常遵循以下原则。
针对性原则:数据进行格网化时,要根据各指标数据的不同特征选择合适的数学模型有针对性地进行格网化。
实际性原则:进行数据格网化时,应根据研究区域实际情况、研究精度实际要求及所获得数据源的实际质量,从实际情况出发,进行格网系统的选择。从总体上讲,格网越小,其研究精度就越高。对于一个研究区域,如果格网的大小和整个研究区域相当显然没有实际意义。同样格网太小也会失去意义,如1cm格网上的耕地面积变化率就没有什么实际意义。
综合性原则:在进行数据格网化时,应充分考虑各指标因子的具体情况及对其产生影响的各种因素。
2.数据格网尺度的选择
研究空间尺度的选择与确定,首先是根据研究区域的范围所确定的空间幅度,选择制图比例尺;然后根据其空间幅度及其制图比例尺来确定格网像元大小。理论上,GIS中空间数据格网的大小可以是无级的,即可以小到无穷小,也可以大到无限大。但在实际的GIS空间数据管理与组织时,其格网大小是有尺度性或者有尺度性制约的。制约地理空间数据格网大小的主要因素有人的肉眼辨识效果、数据实现的精度保证、数据量大小、数据源的特征等方面。而我们确定空间数据格网大小,从本质上说,就是确定一个阈值,在这个阈值上,既能达到人类肉眼辨识效果的要求,又能较好地实现格网地理空间数据的数据精度与数据量之间的平衡[47]。
根据上述格网化原则、格网尺度的选择依据、所选择研究区域的实际情况及研究中所收集到的数据情况,笔者经过对比不同尺寸网格对景观空间分异的表达能力,最终选取的网格尺寸为2km×2km,这样整个研究区域被划分为1437个网格。
大庆城市景观类型网格地图图谱的生成,包括了以下几个步骤:
(1)按照行政区域做方里网格,ArcGIS软件中可用渔网命令(fishnet)完成。并同时在属性表里添加相应的编码、格网面积及比重等字段。
(2)将做成的网格图与研究区的行政区界范围图进行裁剪,以保证各期网格图的统一,如图2-8所示。

图2-8 大庆市区网格图
(3)将网格的属性数据库与大庆城市景观分类属性数据库进行空间连接,通过与网格面积进行相除可以得出各景观类型占每个网格的比重。
(4)将1988年、1996年、2013年三期景观矢量图,按前面的二级分类标准,单独输出一层,并与网格地图进行空间连接,并将图斑比重赋到网格属性数据库中。这样就可以生成每一期每一个景观类型的比重图谱。
(5)在网格图层里添加1988年、1996年、2013年比重的属性字段及1988—1996、1996—2013、1988—2013属性字段,同样采取空间连接的方法,将BZ1988、BZ1996、BZ2013赋值,并通过做差值,将1988—1996、1996—2013、1988—2013赋值。(因为6种地类,此步骤需重复6次)最后通过图幅整饰,形成各景观类型变化率的网格图谱。
最终我们不仅可以得到1988年、1996年、2013年三期六类景观类型的分级比重图谱和1988—1996年、1996—2013年、1988—2013年各景观类型变化率的网格图谱,同时还可以获取任一网格中某种景观类型的比重值(在软件ArcGIS10中,鼠标单击任一网格,都会显示该网格中某景观类型的比重值)。如图2-9所示,这为大庆市景观结构变化规律谱系图的建立提供了数据支持。

图2-9 (a)~(e)大庆市景观类型分级网格比重值

图2-9 (a)~(e)大庆市景观类型分级网格比重值(续)
2.2.4 社会统计数据来源及预处理
研究所采用的社会经济来源清单见表2-19。
表2-19 大庆市社会统计数据来源一览表

采用Microsoft Excel对统计数据进行预处理,对大庆市各年的统计数据进行了汇总和编辑整理。预处理过程包括以下几个方面。
① 衍生变量的计算:如人均值、比重值等。
② 管辖范围的换算:大庆市在1990年才将四县划归到大庆的管辖下,因此需要对大庆市管辖区1990年以前的数据加以换算。
③ 在利用遥感解译得到的土地利用结构数据和社会经济统计数据进行回归分析时,由于遥感图像的成像时间逐年并不统一,且与统计数据的时间(每年年末)不吻合,必须对前者的时间进行纠正。由于土地利用年变化规律未知,所以无法做线性插值或外推。本书采用类似与像元重采样中的“最近领域法”,将遥感图像成像时间的土地利用结构近似地等于距该时点最近的整数年末的土地利用结构(见表2-19)。从而可以将遥感解译的各种土地利用类型的面积和比重数据与统计数据建立数据对,作为本书各种统计分析的基本样本。