预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

共享显露模式的挖掘算法研究的中期报告 基本情况概述 共享显露模式的挖掘算法是一种用于寻找多个集合之间的交集的数据挖掘算法。共享显露模式指的是出现在多个数据集合之中且在多个数据集合中出现的项集。在这种算法中,我们需要找到在所有集合之间都存在的项集,这些项集就是共享显露模式。共享显露模式的挖掘算法可以被广泛应用于各种领域,如市场营销、医疗保健等。 目前,已经有很多关于共享显露模式的挖掘算法的研究,但是这些算法都有其自身的局限性。本次研究我们提出了一种新的共享显露模式的挖掘算法,该算法采用了基于数据的方法,能够在大规模数据集合中有效地寻找共享显露模式。 研究进展 我们提出的基于数据的共享显露模式挖掘算法,首先利用密度估计方法对数据进行预处理,以消除大量的噪音数据对共享显露模式的影响。之后,采用了一种新的依赖度度量方法来计算项集之间的关联度,并对所有项集进行筛选,仅保留具有高关联度的项集。最后,我们采用了一种基于图的方法,将所有候选项集表示为图,并在该图上执行子图挖掘算法来寻找共享显露模式。 我们通过实验验证了我们提出的共享显露模式挖掘算法的有效性。实验结果表明,在大规模数据集合上,该算法能够快速且准确地找到共享显露模式。此外,我们还对算法进行了可扩展性测试,结果表明,该算法可以扩展到大规模的数据集合上。 结论与展望 本次研究提出了一种新的共享显露模式挖掘算法,该算法采用了基于数据的方法,能够在大规模数据集合中有效地寻找共享显露模式。实验结果表明,该算法在速度和准确性方面都有很好的表现,并且具有很好的可扩展性。未来,我们将继续优化该算法并将其应用于实际问题中。