预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于专家知识的决策树分类 可以将多源数据用于影像分类当中,这就是专家知识的决策树分类器,本专题以ENVI中DecisionTree为例来叙述这一分类器。本专题包括以下内容:专家知识分类器概述知识(规则)定义ENVI中DecisionTree的使用概述基于知识的决策树分类是基于遥感影像数据及其他空间数据,通过专家经验总结、简单的数学统计和归纳方法等,获得分类规则并进行遥感分类。分类规则易于理解,分类过程也符合人的认知过程,最大的特点是利用的多源数据。如图1所示,影像+DEM就能区分缓坡和陡坡的植被信息,如果添加其他数据,如区域图、道路图土地利用图等,就能进一步划分出那些是自然生长的植被,那些是公园植被。 HYPERLINK"http://bbs.esrichina-bj.cn/ESRI/attachment.php?aid=66277&k=9e19233ce1a2a5f1213f88eafeb80a0b&t=1283325724&nothumb=yes&sid=7401YkC%2FiST3XljM9syZFl6Re0h%2BzVxIRLm4E21Qg6wBSYk"\o"图1.JPG"\t"_blank"下载(36.31KB) 2008-11-313:53 图1专家知识决策树分类器说明图 专家知识决策树分类的步骤大体上可分为四步:知识(规则)定义、规则输入、决策树运行和分类后处理。1.知识(规则)定义规则的定义是讲知识用数学语言表达的过程,可以通过一些算法获取,也可以通过经验总结获得。2.规则输入将分类规则录入分类器中,不同的平台有着不同规则录入界面。3.决策树运行运行分类器或者是算法程序。4.分类后处理这步骤与监督/非监督分类的分类后处理类似。知识(规则)定义分类规则获取的途径比较灵活,如从经验中获得,坡度小于20度,就认为是缓坡,等等。也可以从样本中利用算法来获取,这里要讲述的就是C4.5算法。利用C4.5算法获取规则可分为以下几个步骤:(1)多元文件的的构建:遥感数据经过几何校正、辐射校正处理后,进行波段运算,得到一些植被指数,连同影像一起输入空间数据库;其他空间数据经过矢量化、格式转换、地理配准,组成一个或多个多波段文件。(2)提取样本,构建样本库:在遥感图像处理软件或者GIS软件支持下,选取合适的图层,采用计算机自动选点、人工解译影像选点等方法采集样本。(3)分类规则挖掘与评价:在样本库的基础上采用适当的数据挖掘方法挖掘分类规则,后基于评价样本集对分类规则进行评价,并对分类规则做出适当的调整和筛选。这里就是C4.5算法。4.5算法的基本思路基于信息熵来“修枝剪叶”,基本思路如下:从树的根节点处的所有训练样本D0开始,离散化连续条件属性。计算增益比率,取GainRatio(C0)的最大值作为划分点V0,将样本分为两个部分D11和D12。对属性C0的每一个值产生一个分支,分支属性值的相应样本子集被移到新生成的子节点上,如果得到的样本都属于同一个类,那么直接得到叶子结点。相应地将此方法应用于每个子节点上,直到节点的所有样本都分区到某个类中。到达决策树的叶节点的每条路径表示一条分类规则,利用叶列表及指向父结点的指针就可以生成规则表。 HYPERLINK"http://bbs.esrichina-bj.cn/ESRI/attachment.php?aid=66278&k=fc723f06b6751f3577f3dd9532bc7095&t=1283325724&nothumb=yes&sid=7401YkC%2FiST3XljM9syZFl6Re0h%2BzVxIRLm4E21Qg6wBSYk"\o"图2.JPG"\t"_blank"下载(10.36KB) 2008-11-313:53 图2规则挖掘基本思路 算法描述如下:算法:从空间数据集(多波段文件)中挖掘分类规则输入:训练样本输出:分类规则表方法:一、读取数据集名字二、读取所有的训练样本A、读取属性信息C、原始类E、样本值A,并将样本划分为训练样本(2/3)和评价样本(1/3)。B、属性信息C可以是连续(DISCRETE)或离散(CONTINUOUS)的,分别将属性注上这两种标记;若属性是DISCERTE,读取其可能取得值,并都存储在一个列表中;每一个属性都有一个标记,一个给定的属性编号及初始化的取值列表均存储于一个属性的数据结构中,并将数据结构存储在一个哈希表中。C、原始类E当作一个附加属性信息储存在属性列表中。D、以增量方式读取每一个样本A,将所有的样本储存在一个表中,每一行代表一个样本。三、利用数据集构建树A、离散化连续条件属性CDISCRETE,获得的分割点集T(t1,t2……)作为条件属性C的新的取值。B、分别计算所有