预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于粒计算的决策表属性约简的综述报告 粒计算(RoughSet)是一种新兴的数据分析工具,其主要思想是通过对数据表格中冗余数据和无用信息的削减,从而发现数据集合内隐藏的规则,以揭示数据集合所固有的内在结构和规律。决策表属性约简是粒计算中的一个重要问题,针对此问题,目前国内外学者们提出了各种方法,并取得了显著的研究成果。 一、决策表属性约简的定义和目的 决策表是“属性-决策”对的集合,其中每个“属性-决策”对构成一个样本,它经常用来表示实体与它们相关的属性和规则的一个集合。属性约简指的是在保留决策完整的前提下,删除表中的某些属性,以达到简化表格的目的。属性约简的核心目的是在某些性能评估指标不变的情况下,去掉一些无用因素以减少计算量。 二、决策表属性约简的粒计算方法 1.基于启发式算法的约简方法 启发式算法基于人的经验和领域知识,借助各类启发规则对某个问题进行搜索求解,其计算复杂度较低,效率较高。启发式算法主要包括基于粒计算的约简算法和基于遗传算法的约简算法。 2.基于粗糙集理论的约简方法 粗糙集理论是粒计算的一个重要分支。在粗糙集理论中,通过近似算子将数据集划分为若干模糊概念。基于粗糙集理论的约简算法主要包括C-INC(X)和C-RED(X)算法。C-INC(X)算法主要基于知识的偏序关系映射进行属性约简,C-RED(X)算法则基于知识的不等式关系映射。C-RED(X)算法在约简效果和时间效率方面都有较好的表现。 3.基于粒度学习的约简方法 粒度学习是粒计算的新兴分支,旨在将不同的抽象级别的信息结合在一起。基于粒度学习的约简算法主要包括增量式约简算法和组合式约简算法。增量式约简算法将新的的属性加入到已有属性集合中进行约简,组合式约简算法则将多个条件属性集合组合起来进行约简。 三、决策表属性约简的应用 决策表属性约简通过精简数据集合,将大数据分析以及机器学习等领域的效率提升到了一个新的高度。应用领域涵盖了大型企业、科研机构、医疗保健、政府和教育等领域。具体可应用于以下几种情况: 1.大数据过滤 现在互联网上的大数据量已经超出了我们处理的能力,而通过增量式约简算法可以快速地过滤出不必要的数据,尤其对于金融保险、贷款数据的处理有很好的作用。 2.医疗保健 医疗保健数据中涵盖了各种疾病的标记和诊断信息,而通过粒计算算法进行约简可以提高我们医疗保健数据的效率。 3.市场营销 营销员可以通过约简少量的属性,推广他想要推广的产品,而不必为了分析大量的数据而打起精神,相信这被应用于营销策略中,可以带来明显的提升。 综上所述,决策表属性约简的研究为数据分析提供了新的思路和方法,不仅提高了数据分析的效率,也促进了对数据集合内在结构规律的发现,对于各种领域广泛应用具有重要意义和价值。