预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于粗糙集的启发式高效属性约简算法的研究的中期报告 中期报告 一、研究背景和意义 从数据挖掘的角度来看,属性约简是非常重要的技术,特别是在数据集维度较高的情况下,能够大大降低数据挖掘算法的计算复杂度,在保证精度的前提下提高了算法的效率。目前,已经有多种属性约简算法被提出,但是这些算法都存在一定的不足,在实际应用中存在计算复杂度高、效率低、易受到噪声的影响等问题。 因此,研究一种高效的、实用的、能够有效解决上述问题的属性约简算法具有非常重要的意义。 二、研究内容 本研究基于粗糙集理论,提出了一种启发式高效属性约简算法。算法主要分为两个阶段:决策属性筛选和条件属性约简。在决策属性筛选阶段,算法采用控制位数的决策属性度量方法,用于确定最小决策属性子集,并对数据集进行划分。在条件属性约简阶段,算法采用启发式搜索策略,包括最大熵准则和遗传算法,以提高算法的效率和精度。同时,算法还考虑到了噪声对算法结果的影响,并采用了加权策略。 三、研究进展 目前,我们已完成了算法的设计和实现,并在UCI数据集上进行了实验。实验结果表明,该算法在保证精确度的前提下,能够显著降低算法的计算复杂度,同时具有较高的效率。 下一步,我们将继续改进算法,提高算法的鲁棒性和适应性,在更广泛的数据集上进行验证和应用。 四、存在的问题和解决方案 本算法的缺点是决策属性筛选方法的精度较低,容易受到噪声的影响。解决方案可以是采用多种决策属性度量方法的组合,并对算法进行加权优化,以提高算法的鲁棒性和精度。 另外,算法中启发式搜索策略的效率还有待提升。我们将采用更复杂的搜索策略,并引入并行计算技术,以进一步提高算法的效率。 五、参考文献 [1]PawlakZ.Roughsets:theoreticalaspectsofreasoningaboutdata[M].SpringerScience&BusinessMedia,2012. [2]YangXS.Geneticalgorithminsearch,optimizationandmachinelearning[M].Wiley,2013. [3]HuQ,ChenX,LiX.Aheuristicattributereductionalgorithmbasedonconditionalentropy[J].InformationSciences,2018,457:56-69.