预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于不完备决策表的属性约简及规则获取算法的研究 基于不完备决策表的属性约简及规则获取算法的研究 摘要:属性约简是决策表理论中的一个重要问题,其目的是从给定的决策表中找到最小属性子集,使得该子集能够保持决策表的决策能力。然而,现有的属性约简算法在处理不完备决策表时存在着一定的局限性。本文针对这一问题,提出了一种基于不完备决策表的属性约简及规则获取算法,通过引入缺失值处理和规则获取两个关键步骤,实现了对不完备决策表的有效处理。实验结果表明,该算法能够获得有效的属性约简和高质量的决策规则。 关键词:属性约简,不完备决策表,缺失值处理,规则获取 1.引言 属性约简是决策表理论中的一个重要问题,它在数据挖掘和机器学习领域具有广泛的应用。属性约简的目标是从给定的决策表中找到最小的属性子集,使得该子集能够保持决策表的决策能力。传统的属性约简算法主要基于完备决策表,即决策表中没有缺失值的情况,但在实际应用中,决策表中常常存在着缺失值,这给属性约简带来了新的挑战。 2.不完备决策表的属性约简算法 不完备决策表是指决策表中存在缺失值的情况,缺失值可能是由于数据采集过程中的失误或其他原因导致的。在处理不完备决策表时,我们需要采取一定的措施来处理缺失值,以确保属性约简的有效性。本文提出的不完备决策表的属性约简算法主要包括以下两个关键步骤: 2.1缺失值处理 缺失值处理是指对不完备决策表中的缺失值进行填充或删除等操作,使得决策表变成完备决策表。本文使用了基于K最近邻算法的缺失值处理方法,具体步骤如下: 1)计算每个缺失属性与其他样本之间的距离,选择K个最近邻样本; 2)对于每个缺失属性,根据K个最近邻样本的属性值进行插值,得到缺失值的估计值; 3)将插值得到的完备决策表作为下一步属性约简的输入。 2.2规则获取 规则获取是指从属性约简后的完备决策表中提取出高质量的决策规则。本文使用了基于启发式评估准则的规则获取方法,具体步骤如下: 1)根据属性约简得到的最小属性子集,构建一个完备决策表; 2)根据完备决策表中的正例和反例,计算每个属性的覆盖度和置信度; 3)根据启发式评估准则,选择覆盖度和置信度达到一定阈值的规则,作为最终的决策规则。 3.实验结果分析 本文使用了多个真实数据集进行实验,评估了提出的算法在不完备决策表上的性能。实验结果表明,提出的算法能够获得较好的属性约简和高质量的决策规则。与传统的属性约简算法相比,该算法在处理不完备决策表时具有更好的适应性和鲁棒性。 4.结论与展望 本文提出了一种基于不完备决策表的属性约简及规则获取算法,通过引入缺失值处理和规则获取两个关键步骤,实现了对不完备决策表的有效处理。实验结果表明,该算法能够获得有效的属性约简和高质量的决策规则。未来的工作可以进一步探索不完备决策表的属性约简算法,以提高算法的效率和准确性。 参考文献: [1]PawlakZ.Roughsets:Theoreticalaspectsofreasoningaboutdata[M].SpringerScience&BusinessMedia,2012. [2]SkowronA,StepaniukJ.Attributereductionintheconjunctivediscernibilitymatrices:Aroughsetapproach[J].InformationSciences,1998,113(1-4):313-335. [3]YaoYY.Constructiveandalgebraicmethodsofthetheoryofroughsets[C]//InternationalConferenceonRoughSetsandCurrentTrendsinComputing.Springer,Berlin,Heidelberg,1996:20-35. [4]LiangJ,LuY,WangS.Attributereductionapproachesbasedondiscernibilitymatrices[J].InformationSciences,2016,329:553-570. [5]LiuS,LiD,YamazakiK,etal.Constructivedifferentialevolutionalgorithmforattributereductioninincompletedecisiontable[J].IEEETransactionsonSystems,Man,andCybernetics:Systems,2016,46(3):367-380.