预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

多粒度粗糙集的近似集动态更新方法研究波兰数学家Pawlak于1982年提出一种处理模糊知识的数学工具,即粗糙集理论。经典粗糙集利用论域上单个不可分辨的二元关系导出等价类,通过讨论等价类与目标概念之间的关系计算出上近似集和下近似集。粒计算是一门快速发展的新兴学科,词计算模型、粗糙集模型和商空间模型是三种主要的粒计算模型。当前,粗糙集理论已成为研究粒计算的重要模型工具。从粒计算的角度来看,经典粗糙集是一种基于单层次、单粒度的粒计算模型,不能从多层次、多粒度的视觉分析和处理问题。因此,钱宇华等人根据粒计算的思想,采用多粒度的观点,提出了基于完备信息系统的多粒度粗糙集模型。目前,随着信息技术的飞速发展,信息系统中数据会随着时间而不断变化,由此可见,多粒度粗糙集中的知识也会随之发生动态变化,研究人员已经为粗糙集模型以及其扩展模型提出了许多用于知识获取的动态更新算法。然而,所提的动态更新算法大多是基于单粒度粗糙集模型而研究的,讨论的是在完备信息系统中当数据变化时如何更新近似集的问题,但关于多粒度粗糙集及其扩展模型中近似集动态更新算法的研究却寥寥无几,并且在部分研究中,近似集动态更新算法的时间效率较低。在现有的信息系统中,由于信息记录的丢失或收集信息的失误,导致要处理的信息中可能包含缺失值,因此当学者们要获取知识时,经常需要处理属性值不全的信息系统。当不完备信息系统中数据发生变化时,由于它包含缺失值,发生的情况会比完备信息系统更加复杂。当不完备信息系统变化时,常见的多粒度粗糙集模型很难对它进行处理。因此,很少有学者研究关于不完备信息系统下的近似集动态更新算法。对于上述两个问题,本文分别以完备信息系统和不完备信息系统为研究基础,做了以下两个方面的讨论:(1)在多粒度粗糙集环境中,当完备信息系统中属性值被细化时,原来的近似集会发生变化,即下近似集有增大的趋势,上近似集有减小的趋势,且现有的近似集更新算法时间效率较低,则改进现有的近似集动态更新算法成为了多粒度粗糙集理论研究中的重要内容。为此,在多粒度环境下,针对信息系统中属性值被细化的情况,讨论了乐观、悲观多粒度粗糙集中近似集动态更新的相关性质与定理,提出了近似集动态更新算法。该算法的基本思想是不需要重新计算细化属性值时信息系统中对象的等价类,只需根据论域中不同局部范围内的属性值是否不相等来计算近似集,即根据对象的不等价类来更新近似集。最后,在UCI公共数据集中进行了大量的实验,实验结果表明所提算法在更新近似集的时间效率上优于对比算法,从而验证了所提出算法的正确性和高效性。(2)针对不完备信息系统变化可能获得缺失值的特性,为解决多粒度粗糙集中更新近似集时间效率较低的问题,提出了基于容差关系近似集动态更新算法。首先,讨论了基于容差关系近似集变化的性质,并根据相关性质得出乐观、悲观多粒度粗糙集中近似集的变化趋势。随后,针对更新容差类时间效率较低的问题,提出了动态更新容差类的定理,利用此定理来动态更新容差类,缩短了更新近似集的时间,并在此基础上,设计出基于容差关系近似集动态更新算法。采用UC-I数据库中4个数据集进行仿真实验,当数据集逐渐变大时,所提算法和静态算法的计算时间差距也越来越大。实验展示了动态算法比静态算法计算时间效率高的结果,从而说明了所提动态算法的正确性和高效性。