预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于区分向量的不完备决策系统属性约简算法 区分向量是决策系统属性约简中常用的方法之一。在属性约简中,我们希望找到一些最重要的属性来描述决策系统,以减少处理决策系统所需的计算量。 本文将围绕区分向量的不完备决策系统属性约简算法来展开。首先,我们将介绍什么是区分向量和不完备决策系统。接着,我们将详细讲解区分向量的不完备决策系统属性约简算法。最后,我们将对该算法进行评估和总结。 一、区分向量和不完备决策系统 区分向量是一种用于描述决策系统的向量,其每个维度表示对于该决策系统一个属性的分类决策。如果对于某个属性的取值,所有样本的分类决策都相同,那么这个属性就是不区分的。否则,这个属性就是区分的,其在向量中对应的维度值为1。例如,在一个二元决策系统中,区分向量$[0,1]$表示该决策系统中有一个区分属性。 在某些情况下,我们的决策系统可能存在“未知”的取值。这些取值不具有分类决策,或者我们无法获得样本来进行分类。这种情况下,我们称决策系统为不完备决策系统。 二、区分向量的不完备决策系统属性约简算法 区分向量的不完备决策系统属性约简算法是一种在不完备决策系统中,利用区分向量来找到最小属性子集的方法。该算法的步骤如下: 1.计算完备决策系统中的区分向量$d$。 2.将不完备决策系统中的缺失数据补充,使其成为完备决策系统。这个过程可能需要使用一些方法(如插值或者估计)来填补缺失数据。 3.对于每个属性,计算从不同口径集合的属性中消除该属性后的区分向量$d-A$,其中$A$表示该属性集合。如果某个属性的消除后的区分向量与未消除的区分向量相同,那么这个属性就是可替换的,可以从属性集合中删除。 4.递归地删除可替换的属性,直到找到一个无可替换属性的最小属性子集。 三、算法评估和结论 该算法具有一定的优点和不足,我们将分别进行评估。 优点: 1.该算法可以在不完备决策系统中寻找最小的属性子集来描述决策系统,从而减少了处理决策系统所需的计算量。 2.该算法使用区分向量的方法来进行属性约简,能够较好地区分决策系统中的属性。 不足: 1.由于该算法需要补全不完备数据,因此其处理不完备数据的能力受到了限制。 2.该算法需要计算不完备决策系统中所有可能的属性子集,因此对于高维数据集效率较低。 综上所述,区分向量的不完备决策系统属性约简算法是一种基于区分向量的属性约简方法,可用于在不完备决策系统中找到最小属性子集,以减少处理决策系统所需的计算量。但其处理不完备数据的能力受到了限制,同时对于高维数据集效率较低。因此,在使用该算法时应注意数据的完备性和数据集的维数。