预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于多最小支持度的关联规则挖掘研究的中期报告 1.研究背景和意义: 关联规则挖掘是数据挖掘领域中的一项重要研究方向,主要用于挖掘大规模数据集中的有趣关系。现有的关联规则挖掘算法中,最小支持度(minimumsupport,简称minsup)是一个重要参数,用于确定频繁项集的阈值。然而,使用单一的minsup值无法充分挖掘数据集中的多层次关系,因此,近年来出现了多最小支持度的关联规则挖掘算法。这些算法可以采用不同的minsup值来分析数据集中的不同层次,从而提高关联规则挖掘的效率和可靠性。 2.研究内容和目标: 本文基于多最小支持度的关联规则挖掘算法,在实际数据集上进行了实验验证,主要研究内容和目标如下: (1)分析多最小支持度对关联规则挖掘效果的影响,并对比不同算法之间的优缺点。 (2)提出一种基于数据分布的多最小支持度选择方法,可以根据数据集的特点选择最佳的minsup值。 (3)针对大规模数据集的关联规则挖掘问题,提出一种基于MapReduce的并行化算法,可以加速关联规则的挖掘过程。 3.研究方法和步骤: (1)收集并整理相关的关联规则挖掘算法和数据集。 (2)分析不同的多最小支持度算法,并选择适合本研究的算法进行实验验证。 (3)利用选定的数据集,对不同的算法进行实验,并对比其效果以及运行时间等指标。 (4)针对多最小支持度选择方法和并行化算法的研究内容,进行相关实验和验证。 (5)总结实验结果,提出结论和改进的方向。 4.预期成果和贡献: (1)实现多最小支持度的关联规则挖掘算法,并进行实验验证。 (2)提出一种基于数据分布的多最小支持度选择方法,可以根据数据集的特点选择最佳的minsup值。 (3)提出一种基于MapReduce的并行化算法,可以加速关联规则的挖掘过程。 (4)总结算法的优缺点,为关联规则挖掘算法的改进提供参考。 (5)该研究可以为数据挖掘领域中的关联规则挖掘算法提供新的思路和方法,提高数据挖掘的效率和质量。