预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

关联规则增量式更新算法的研究的综述报告 关联规则挖掘是数据挖掘中的重要技术之一,它可以帮助我们从大量数据中发现有意义的关联性,如商品销售关系、疾病发生规律等。传统的关联规则挖掘中常采用Apriori算法和FP-Growth算法,但这些算法都是离线建模的方式,对于数据变化较大的情况下,需要重新构建模型。为了解决这个问题,研究者们提出了关联规则增量式更新算法,本文对此进行综述。 1.关联规则增量式更新算法的概述 关联规则的增量式更新算法是指在原有的关联规则基础上,通过增量式的方式更新关联规则。这样在数据发生变化时,可以避免重新构建整个模型,从而提高了计算效率。这类算法主要有三种:Apriori-Inc算法、Growth-Miner算法和CRCM算法。 2.Apriori-Inc算法 Apriori-Inc算法是Apriori算法的增量式更新版本,它会在每次新增数据时,同时对频繁项集和关联规则做出更新。该算法首先利用原有的频繁项集推出新增数据的候选项集,然后再对候选项集运用Apriori算法进行筛选,得出新的频繁项集和关联规则。在处理频繁项集时,Apriori-Inc算法会更新存储在树结构中的候选项集,以避免计算重复,从而优化计算效率。 3.Growth-Miner算法 Growth-Miner算法是FP-Growth算法的增量式更新版本,主要简化了树构建和频繁项集挖掘的过程。Growth-Miner算法首先构建一个新的FP树,将新增数据加入到该树中,并根据新的FP树来产生更新后的频繁项集和关联规则。在不断更新的过程中,会产生大量FP树,因此Growth-Miner设计了一种淘汰机制,在每次产生新的FP树时,会将旧的FP树淘汰掉,从而保证空间效率。 4.CRCM算法 CRCM算法是关联规则增量式更新算法的另一种重要实现形式。它采用了一种基于置信度变化的快速增量式更新策略,可以在原有规则前提不变的情况下,准确地计算规则置信度的变化情况。当数据发生变化时,将原有的规则置信度更新为新的值,并删除不满足支持度和置信度阈值的规则。这种算法在增量式更新的同时保证了规则的准确性。 5.总结 本文主要对关联规则增量式更新算法进行了综述,这类算法都是在传统关联规则挖掘算法的基础上,通过增量式的方式对模型进行更新,从而在保证模型准确性的前提下提高效率。Apriori-Inc、Growth-Miner和CRCM都是较为重要的更新算法,它们可以满足不同的数据要求。未来的研究领域可能侧重于增加算法的精度和准确性,使其更适合处理大规模变动的数据。