预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

增量式属性约简更新算法研究的任务书 任务书 一、研究背景与意义 在数据挖掘领域中,数据预处理是数据挖掘过程中不可缺少的步骤。其中,属性约简是一种有用的数据预处理技术,在去除无用属性和冗余属性的同时,能够保留核心属性,提高数据挖掘算法的效率和准确性。在属性约简中,增量式属性约简是一种已有的优化算法。它能够在原有约简结果的基础上,利用新的数据进行增量计算,以更新已有的约简。然而,当前研究中的增量式属性约简更新算法存在一些问题,如算法的时间复杂度高、实用性差等。因此,开展增量式属性约简更新算法的研究,对于提高属性约简的实用性和精度具有重要的意义。 二、研究目标 1.分析现有增量式属性约简更新算法的优缺点和存在的问题。 2.设计一种新的增量式属性约简更新算法,使之具有更高的实用性和更好的效率。 3.通过对不同数据集的测试和对比实验,验证新算法的可行性和有效性。 三、研究内容和难点 1.分析和总结当前增量式属性约简更新算法的研究现状,归纳算法特点和存在的问题。 2.在理解已有方法的基础上,通过对原有算法的优化和改进,提出新的增量式属性约简更新算法,使之具有更高的实用性和效率。 3.针对新算法的难点,进行深入分析和探讨,并给出相应的解决方案。主要包括如何解决信息熵计算过程的高时间复杂度、如何使用多重约简增强算法对属性进行选择等问题。 4.通过大量的实验测试,在真实数据集上对比新算法和现有算法的表现,在有效性和效率上进行评价和分析。 四、研究方法和流程 1.文献综述:通过查阅相关文献和研究报告,对当前增量式属性约简更新算法的研究现状以及存在的问题进行总结和分析。 2.算法设计:在已有算法的基础上,提出新的增量式属性约简更新算法,并根据具体问题的实际情况,做出相应的优化和改进。 3.算法实现:完成新算法的程序实现,并进行测试和调试。 4.实验分析:在真实数据集上进行实验测试,并评价分析新算法的有效性和效率表现。 五、预期研究成果 1.总结并归纳现有增量式属性约简更新算法的研究现状、优缺点和存在的问题。 2.提出一种新的增量式属性约简更新算法,并通过改进算法,使其具有更高的实用性和更好的效率。 3.通过在不同数据集上的测试和对比实验,验证新算法的可行性和有效性。 4.论文发表:在数据挖掘领域核心期刊或国际会议上发表一篇学术论文。 六、研究计划与进度 计划周期:2021年10月-2022年6月 预期进度: 1.文献综述及问题分析:2021年10月-2021年11月 2.算法设计及优化:2021年11月-2022年2月 3.算法实现及测试:2022年2月-2022年4月 4.实验分析及论文撰写:2022年4月-2022年6月 七、参考文献 [1]刘长领.基于约简的数据挖掘[M].北京:清华大学出版社,2012. [2]张洁,李龙龙.增量式属性约简算法研究[J].电子学报,2013,41(10):2043-2049. [3]ZhouQ,LiZ,WangX,etal.Animprovedincrementalattributereductionalgorithm[J].JournalofInformationScienceandEngineering,2014,30(3):849-869. [4]WangH,LinT,HuangM.ANovelIncrementalAttributeReductionAlgorithmBasedonFuzzyRoughSet[J].JournalofInformationandComputationalScience,2018,15:3751-3762.