01 决策树模型的简单介绍
决策树思想的来源非常朴素,程序设计中的条件分支结构就是if-else结构,最早的决策树就是利用这类结构分割数据的一种分类学习方法
决策树:是一种树形结构,其中每个内部节点表示一个属性上的判断,每个分支代表一个判断结果的输出,最后每个叶节点代表一种分类结果,本质是一颗由多个判断节点组成的树。
对于决策树,大家想象一棵树的生长,是不是先有根(叫作根节点),然后由根继续长大,然后会分叉(即将分叉的位置称为节点),再分叉...最后长出叶子(又叫叶子节点)。
那么对于决策树模型,其实按照这种思路进行的分类。首先所有需要分类的物质(物质两个字用的不太恰当,但是想不出什么好听的了)全部汇聚在根部,每分叉一次其实就是根据某一种限制条件将上一个节点中的物质进行了是或者不是的分类。
来一张决策树模型中用的比较多的图片:
现在我们要解决的是,给定一张遥感影像,如何通过决策树模型将不同地形区分开来。
譬如,对于水体区域,你将所有的水体像素点找出来;对于裸地区域,你用另一种颜色将这些裸地像素点标识出来...
其实这就是简单的if-else结构,因为对于不同的地形的区分,我们已经又现成的可量化的数值去衡量判定它,譬如NDVI、slope、band、aspect等等。
这是几种地形的区分数值参照表,后续我们将参照其构建决策树模型。
构建之前,我们需要明确,我们的遥感影像需要有哪些数据?
通过上面出现的数值我们可以简单的分析出,NDVI需要使用到波段数据,slope则需要使用到DEM数据。
02 实操
2.1 加载遥感影像以及对应的DEM影像
打开的遥感影像展示:
2.2 新建决策树
2.2.1 找到 新建决策树 工具并点击打开
2.2.2 决策树的编辑
再来看一下需要分类的地形以及划分的标准
可以发现,我们可以通过NDVI是否大于0.3分成两大类,一类可以通过band4是否大于0小于20分成三种地形(水体,裸地,无数据区,背景),另一类可以通过slope是否小于20分成两大类。这两小类中一类是缓坡植被,另一类通过aspect是否大于90且小于270分为两种地形(朝南陡坡植被,朝北陡坡植被)。相信这是比较简单的。
现在我们再来稍微掌握以下ENVI_IDL语言的一些简单语法:
大于:gt
描述:gt即为great than短语的简写,这样联想记忆你或许会更明白gt的含义是大于。
小于:lt
描述:lt即为less than短语的简写,这样联想记忆你或许会更明白lt的含义是小于。
等于:eq
描述:eq即为equal单词的简写,这样联想记忆你或许会更明白eq的含义是等于。
大于等于:ge
描述:ge即为great equal单词的简写,这样联想记忆你或许会更明白eq的含义是大于等于。
小于等于:le
描述:le即为less equal单词的简写,这样联想记忆你或许会更明白le的含义是小于等于。
不等于:ne
描述:ne即为not equal单词的简写,这样联想记忆你或许会更明白ne的含义是不等于。
或许你会问,为什么不使用>、<、=这种符号不是更清晰易懂吗?我只能说,你说的对,但那只是对于你来说,对于设计这门语言的人来说,他觉得用英文短语的简写来表示逻辑关系会更清晰易懂,如果你觉得用不习惯你可以选择适应 or 创建一门语言干翻他。
2.2.3 NDVI的表达式编辑
2.2.4 增加子节点
增加好的节点展示:
2.2.5 band4的表达式编辑
2.2.5.1 对于NDVI<=0.3类继续分类。
2.2.5.2 增加节点
2.2.5.3 对band4不属于(0, 20)的类进行再分类。
2.2.6 分类好的信息编辑
2.2.6.1 分类的水体相关信息编辑
2.2.6.2 分类的无数据区相关信息编辑
2.2.6.3 分类的裸地相关信息编辑
2.2.7 重复编辑的说明
因为时间原因,这里就不再重复上面的步骤继续编辑slope以及aspect的信息了。
这里简要的说明一下即可。
slope和aspect都是需要通过DEM进行二次计算得到的,所以编写表达式的时候需要加上{},另外,选择变量对应的数据时slope和aspect都是选择DEM数据。
具体操作看下方图片即可,不再解释。
(slope表达式)
(缓坡植被类信息编辑)
(aspect表达式编辑)
(朝南陡坡植被类信息编辑)
(朝北陡坡植被信息编辑)
(变量对应文件数据的表格查看)
2.3 保存编辑好的决策树模型
如果你下次还需要保存那么你可以保存该决策树模型。
2.4 运行决策树模型
2.5 分类结果展示