国际核心期刊咨询网

当前位置:首页>>农业论文 > 正文

基于地形特征与随机森林的侵蚀沟提取研究

发布时间:2020-06-03

  摘要:侵蚀沟的提取研究为沟壑地貌土壤侵蚀监测提供重要依据。基于无人机获取的高分辨率DOM和DEM计算出地形属性指标,进行不同侵蚀程度范围的多尺度分割,选择最优分割尺度参数并评定分割效果,根据影像数据特征的分类精度构建面向对象分类的特征空间,利用统计分析方法结合机器学习,建立相应的分类规则,对安塞区纸坊沟的侵蚀沟进行提取,实现有效分类。结果表明:在地形数据与光谱特征、纹理特征和几何信息等影像数据结合的特征选择下,侵蚀沟提取效果最佳,最终整体精度达到92.81%,Kappa系数为0.85,分类用户精度最高达到90.01%。侵蚀沟的有效提取不仅掌握了安塞区纸坊沟的土壤侵蚀情况,对后续的水土保持和治理工作也具有重要意义。

基于地形特征与随机森林的侵蚀沟提取研究

  关键词:侵蚀沟地形特征最优尺度分割随机森林规则分类

  1引言

  黄土高原发育和发展的侵蚀沟与土壤的侵蚀作用有着密切的关系,随着对土壤侵蚀研究的深入,专家学者对侵蚀沟的提取研究也在不断成熟。目视解译是最早应用于侵蚀沟提取方法,王庆[1]等结合遥感影像与DEM数据,采用人机交互的方式对侵蚀沟道的长度、面积、类型以及空间位置信息等进行提取与计算。李飞[2]等利用SPOT-5高分辨率遥感影像结合野外实测数据,对吉林省九台市的侵蚀沟数目、裂度、面积进行提取与统计。王文娟[3]等基于SPOT-5影像和Corona影像结合DEM数据,分析了典型黑土区近40年沟蚀的空间格局变化以及地形分异规律。蒲罗曼[4]等则基于多元遥感数据结合DEM数据,运用定性方法综合分析提取侵蚀沟的信息特征。由于解译效果受遥感影像分辨率的限制,解译过程费时费力。CastilloC[5]等利用面向像元分析方法,通过DEM计算坡度、坡向、汇水面积、曲率等地形属性指标,设置合适的阈值结合水文分析自动提取侵蚀沟。结合地形数据提取固然严格明确且提取效率高,但大面积高分辨率DEM数据难以获取,计算地形指标的误差会影响提取精度[6]。随着高分辨率影像的广泛应用,面向对象分析方法被应用于土地覆盖变化[7]、地貌形态分类[8]等领域。采用面向对象的方法对侵蚀沟进行提取时,只使用遥感数据提取侵蚀沟会影响分类精度。因此,利用面向对象的方法结合影像数据与地形数据可以充分利用地形信息、光谱信息、几何信息及纹理信息等综合信息,有效提高现有分析方法的精度[9,10]。

  论文以安塞纸坊沟为例,结合高分辨率DOM和DEM计算得到的地形属性指标,利用地形、光谱、纹理信息构成同质性单元,采用面向对象的方法对安塞的侵蚀沟进行自动提取,比较多种面向对象提取方法的精度,得到最佳的分类效果,进而可以掌握纸坊沟的侵蚀状况,为后续的调查与治理提供相应的依据。

  2研究区概况

  纸坊沟在陕西省延安市安塞区,位于西北内陆黄土高原腹地,鄂尔多斯盆地的边缘,其地理位置在东经109°13′46″-109°16′03,北纬36°42′42″-36°46′28″,流域面积为8.27km2。流域由南到北形成一个狭长的条带形状,沟道长度为8.1km。由于基础地形以及侵蚀作用的影响,流域地貌极为破碎,沟谷纵横。研究区域的位置图如图1所示。

  3数据处理

  3.1数据介绍

  本文实验采用的数据为无人机影像制作而成的DEM以及DOM数据,数据分辨率为0.5m。本次实验中使用的UAV为德国Microdrones公司生产的可垂直升降的四旋翼无人机md4-1000。本研究中无人机上搭载的相机为SonyILCD-7R电子相机,相机焦距为50mm,像素分辨率为7360*4912。

  对DEM数据进行滤波处理,过滤掉过高的高频信息,减少噪声影响。计算出地形属性指标,如坡度、剖面曲率、平面曲率、山体阴影,并对计算得到的地形属性指标进行归一化,减少量纲对后续分割以及分类的影响。

  3.2影像分割算法

  影像分割就是根据影像的光谱特征、纹理特征、地形特征将影像分隔成为满足相似性准则或者具有同质性特征的连通区域的过程[11]。本研究利用多尺度分割算法对影像进行分割,多尺度分割算法采用的是自下而上的区域合并算法,以每一个影像栅格为分割基础,将异质性增量最小的相邻栅格合并为一个单元,分割对象的数量从而不断的增多,当异质性增量的最小值小于所设定的阈值时,区域增长则停止[12]。为了使异质性最小,在影像分割中需要考虑两方面的内容,一个是光谱异质性,另一个是形状异质性,以此来控制分割对象的形状与大小,防止分割之后的对象过于破碎,而且能够保证分割之后的对象形状紧凑、边界光滑。

  实验中主要设置的参数有三个:(1)每一个波段的权重,分割时按照波段的重要性对权重进行设置,每一个波段的权重均为1;(2)异质性因子的设置,主要体现为形状因子与紧致度因子,二者的取值范围为0-1,本文中形状因子的取值范围为0.3-0.5,紧致度因子的取值范围为0.5-0.7;(3)分割尺度参数的设置决定了分割对象的最大异质性值,用来判断分割是否继续进行。一般情况下,分割尺度越大,分割生成的对象面积越大而对象的个数相应的越少。

  3.3最优分割参数选择

  利用面向对象的多尺度分割,分割尺度参数的选择十分重要。分割时尺度的参数大小不同,得到的对象大小以及数量的多少也不尽相同,分割尺度参数设置的值越小,分割得到的对象数目则越多,边界也就越破碎,反之亦然。对于不同的地物,最优分割尺度的参数选择并不是绝对一致,由于地物之间的空间表达以及位深并不完全相同,因此每种地物相对应的最佳分割尺度参数也会不同。为了达到不同侵蚀区域的分割结果最优的要求,需要计算每一个侵蚀区域最适合的分割尺度对影像进行分割,以得到不同侵蚀程度的影像对象。因此,本文考虑在选取不同尺度实现不同侵蚀程度的侵蚀沟的分割。

  ESP工具通过计算在不同的分割尺度下所得到的对象同质性的局部变化(localvariance,LV),并以此作为所分割的对象层的标准差(standarddeviation),从而用于判断分割效果的好坏。每一个形状参数与紧致度参数的组合对应一个最优分割尺度参数,每个组合的最优分割尺度参数的大小也不相同。并且用局部变化的变化率值来表示对象的最佳分割尺度参数,当局部变化(LV)的变化率值(ROC-LV)达到最大值时,该点所对应的尺度参数就可以认为是最优分割尺度参数,如图2所示。

  3.4分割效果评定

  对于分割精度的评定,本文采用ClintonN[13]提出的基于集合对象差异性的评价指标,共包含了三类指标:过分割指数(OR),欠分割指数(UR),误差欧氏距离(ED)。

  分别对两种分割方法的分割结果进行计算,冲沟切沟区分割效果如表1所示,浅沟沟区分割效果如表2所示。

  基于ESP-Tools工具,探测每一种参数的组合成为最优分割尺度的可能。对每一组参数都进行欠分割指数、过分割指数与误差欧氏距离的计算,而误差欧式距离是对过分割指数和欠分割指数的综合,实际应用中一般将误差欧氏距离最小值的分割结果作为最优分割参数[14]。对分割效果进行评价可以最大限度地减少反复试验对比的主观性,降低对影像分类精确度的影响。显然,浅沟区的分割误差要高于冲沟切沟区的分割误差,表明在侵蚀范围提取的过程中,冲沟切沟区更容易提取,而浅沟因为形态小,对参数设定更为敏感,提取较为困难。

  相关知识推荐:测绘工程师如何评审职称?

  4结果与分析

  4.1特征选择

  对象特征是地表物质有关信息的有效表达,也是进行影像分析以及信息提取时的重要参数。对象的组成成分为多个像元栅格,可以根据栅格的特征及其相互之间的关系计算对象的特征值。本文利用R语言中caret分类包对分类特征进行选择,在模型中输入所有特征,计算分类的误差以及预测的分类精度,并对所有特征的重要性进行排序,对若干重要的特征进行保留,再次计算它的误差以及预测分类精度,这样反复的进行迭代,直至得到合适的特征的数量。这个算法最大缺点是会出现过拟合,在这个算法外再加上一个样本划分的循环算法即可解决此问题。地形数据分割后的对象为143个,地形和影像数据分割后的对象为171个,将对象的纹理特征、光谱特征、几何特征全部输出,进行特征选择时,对比分析训练数据与测试数据不同比例下的分类精度,其中50%用做训练样本、50%用做验证样本时分类精度最高。利用随机森林方法创建一个特征筛选算法,对训练数据集进行反向特征选择,检测到当特征选择17(18)个时预测精度最高。数据验证,分类精度可以达到97.82%/94.62%,Kappa系数可达到0.95/0.89。冲沟切沟区地形和影像数据选择的特征如表3所示。

  地形数据中layer1-layer8的数据分别为R、G、B、山体阴影、DEM、剖面曲率、平面曲率、坡度。

  4.2冲沟切沟区的提取

  随机森林方法分类时,有两个重要参数需要设置,一个是树的数目,一个是每次分裂时的变量。研究表明,当树的个数为500时,变量的个数为特征数量的平方根时分类效果达到最好。利用R语言进行特征选择时,得到随机森林分类的树的数目为500,变量的个数为4时分类精度最高。利用易康软件对分割的对象进行分类,其中树的数目为500,变量的个数为4,其他参数为默认值。分类过程中的测试样本与验证样本均来自野外实测数据。影像特征加地形数据的随机森林分类结果如图3所示,其中深色代表冲沟切沟区域,浅色代表分非冲沟切沟区域。

  4.3浅沟区的提取

  根据特征选择得到的特征因子对浅沟区域的分类规则进行选取。在非冲沟切沟范围提取的结果上,选用随机模型对实验区域的数据进行训练,得到不同比例训练数据与测试数据的分类精度,当训练数据与测试数据的比例分别为0.4、0.6时,预测分类精度达到最高,采用此比例得到的特征因子对浅沟区域的分类规则进行选取。由于浅沟区域的颜色与其他区域的颜色有较大的差别,因此可以使用亮度因子进行分类规则的建立。从特征选择结果可以看出利用光谱特征很难对侵蚀沟进行提取,因此纹理特征就成为提取浅沟区域的关键。根据研究区域侵蚀沟类型特征发现,影像上浅沟区域出现条带状的纹理形状,相较于冲沟切沟区域形状较为规则,因此可以通过纹理特征的灰度共生矩阵的相关分量同时结合亮度以及波段的最大化差异度量作为提取浅沟的特征。分类规则如表4所示,其中纹理特征仍占有很大的比重。浅沟区的提取结果如图4所示。

  4.4精度分析

  对上述两种分类方法的提取精度进行计算,冲沟切沟区和浅沟区的提取精度分别如表5和表6所示。其中冲沟切沟区的整体分类精度为92.81%,Kappa系数为0.85,其分类精度较高,随机森林的两类效果优于KNN分类以及SVM分类,凸显出随机森林分类具有分析复杂相互作用分类特征的能力。根据提取结果,可以看出浅沟可以很好被提取,目视解译的结果有40个浅沟对象,利用规则分类提取的浅沟对象为46个,其中漏分的浅沟对象为3个,错分的浅沟对象为2个,提取的用户精度为86.96%。浅沟出现错分漏分的原因在于浅沟比较小,分类时对分类特征较为敏感,而分类特征阈值的确定也对分类精度产生影响。

  5结束语

  基于随机森林算法,综合地形数据与光谱特征、纹理特征和几何信息等影像数据,实现了对安塞区纸坊沟侵蚀范围的自动提取。提取结果表明:地形数据的分类精度整体高于地形加影像数据的分类精度,地形加影像数据分类中随机森林分类方法的精度最高。地形特征与随机森林算法相结合,充分利用了地形、光谱、几何及纹理等综合信息,解决了传统侵蚀沟在地形图上人工目视解译与外业调绘侵蚀沟费时费力的问题,并且分类精度高,为今后侵蚀沟的提取研究与水土保持工作提供了可靠方法和有利依据。本研究未进一步计算侵蚀沟分布带的坡度和坡向,后续会深入研究二者与侵蚀的关系,分析空间格局变化以及地形分布规律。——论文作者:胡荣明 1 吴晓庆 1 周自翔 1 李鹏飞 1 王 舒 2

回到顶部