预览加载中,请您耐心等待几秒...
1/5
2/5
3/5
4/5
5/5

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

决策形式背景属性约简方法研究 摘要 决策问题的复杂性很大程度上来自决策者要处理的大量数据和决策属性。属性约简作为一种重要的数据预处理技术,可以大幅度简化决策属性集,并减少决策的时间和成本。本文介绍了决策形式背景属性约简方法的基本思想和实现步骤,并结合实例说明其在解决决策问题中的应用。最后,本文讨论了该方法的局限性并提出了进一步的研究方向。 关键词:属性约简;决策形式背景;决策问题;优化算法 1.前言 在现代经济和社会发展中,各种决策问题都需要决策者进行综合分析和决策。然而,决策者面临的决策问题往往涉及大量的数据和属性,使得决策过程非常复杂和困难。因此,为了减轻决策者负担,并提高决策的效率和准确性,需要对决策问题进行数据预处理和属性约简。 属性约简的核心思想是寻找一个最小的属性子集,以尽量少的属性来描述数据的特征。由于属性的数量很多,决策者不可能将它们全部纳入考虑范围,因此属性约简的方法可以在尽可能少的属性下满足决策者的需求。属性约简不仅可以用于数据预处理,而且可以作为其他机器学习算法的前置步骤。 2.决策形式背景属性约简方法 决策形式背景是一种跨学科的理论框架,它结合了形式概念分析和决策树的思想,并提出一种特殊的形式背景,用于描述决策问题的数据和属性。形式背景是一个三元组,包括一个对象集、一个属性集和一个关系矩阵,其中对象表示决策问题中的样本数据、属性代表决策问题的属性,关系矩阵表示对象和属性之间的关系。 决策形式背景属性约简方法是利用形式背景进行属性约简的一种方法。具体过程包括以下几步: (1)构建形式背景 根据决策问题的数据和属性,构建一个形式背景,其中关系矩阵表示对象和属性之间的覆盖关系。 (2)计算属性重要度 根据属性的重要度,对属性进行排序,以确定约简的顺序。属性重要度可以使用Shannon熵或加权信息熵等方法进行计算。属性重要度越高,越应该保留该属性。 (3)属性约简 从高到低选取属性,然后计算属性集的下近似和上近似,并求出其支撑度,以判断该属性是否可被删除。具体来说,将属性添加到决策形式背景中,得到一个新的下近似和上近似,然后计算其支撑度。如果支撑度不小于预设阈值,则说明该属性可以被删除。 (4)循环约简 将第三步中被删除的属性重要度重新计算,并重新排序,然后重新执行第三步,直到不能约简为止。 3.应用实例 为了演示决策形式背景属性约简方法的应用,我们将使用一个示例数据集,其中包含六个决策样本和四个属性: |样本|A|B|C|D| |---|---|---|---|---| |x1|是|是|否|否| |x2|是|是|是|否| |x3|否|否|是|是| |x4|否|否|是|否| |x5|否|是|否|否| |x6|是|否|否|是| 第一步是构建形式背景,它由对象集、属性集和关系矩阵组成,如下所示: |-|A|B|C|D| |---|---|---|---|---| |x1|1|1|0|0| |x2|1|1|1|0| |x3|0|0|1|1| |x4|0|0|1|0| |x5|0|1|0|0| |x6|1|0|0|1| 第二步是计算属性重要度。我们使用信息熵方法来计算每个属性的重要度。首先,我们需要计算对象集合C中各个决策结果的概率分布,如下所示: p(是)=3/6=0.5 p(否)=3/6=0.5 现在我们可以计算每个属性的信息熵了,如下所示: H(A)=-[(3/6)log2(3/6)+(3/6)log2(3/6)]=1.0 H(B)=-[(3/6)log2(3/6)+(3/6)log2(3/6)]=1.0 H(C)=-[(2/6)log2(2/6)+(4/6)log2(4/6)]=0.918 H(D)=-[(2/6)log2(2/6)+(4/6)log2(4/6)]=0.918 最后,我们根据每个属性的信息熵计算属性的重要度: I(A)=1.0-0.5=0.5 I(B)=1.0-0.5=0.5 I(C)=1.0-0.918=0.082 I(D)=1.0-0.918=0.082 现在,我们可以按照属性重要度的顺序进行属性约简了。首先,我们选取I(A)最大的属性A,并计算属性集的下近似和上近似如下: |-|A| |---|---| |x1|1| |x2|1| |x6|1| |-|A|B|C|D| |---|---|---|---|---| |x1|1|1|0|0| |x2|1|1|1|0| |x5|0|1|0|0| |x6|1|0|0|1| 计算支撑度如下: supp(A)=3/6=0.5 supp(ABCD)=0/6=0 由于支撑度不小于预设阈值(假设为0.4),因此我们可以删除属性B、C和D。重新计算属性重要度并按顺序执行属性约简步骤,最终得到结果属性子集{A}。 4.局限性和未来研究方向 虽然决策形式背景属性约