预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

兴趣度在增量的关联规则挖掘中的研究 关联规则挖掘是将数据挖掘技术应用于关联规则分析的一种方法,它可以进行交叉销售分析、购物篮分析等多种实际应用。在关联规则挖掘中,频繁集挖掘是一个比较重要的过程,它主要通过扫描数据集来找到频繁出现的元素项集合,然后使用这些频繁项集来构建关联规则。 然而,仅仅挖掘出频繁项集并不能完全说明它们之间存在着强烈的关联性,因为有可能是由于数据集本身的冗余导致频繁项集的出现。因此,在实际应用中,需要将关联规则的置信度作为评估规则强度的一个重要指标。 但是,传统的关联规则挖掘方法只考虑了规则的频繁度和置信度等指标,而对关联规则中孕育的“兴趣度”因素很少关注。兴趣度是指在挖掘关联规则时,规则本身具有的吸引力和有趣性等因素。获得兴趣度高的关联规则可以使人们更好地理解数据集的特征,更好地决策。因此,如何在关联规则挖掘中引入兴趣度这一概念,成为了当前研究的热点问题。 在应用兴趣度方法时,需要进行某些特殊处理。首先,需要从数据集中确定每个特征或属性的重要性权重,其次,需要精心设计兴趣度度量及其计算方法,以体现所需的兴趣度需求。在兴趣度的定义上,首要任务是明确各属性的重要性,并且让兴趣度分数反映对属性权重更加敏感。 近些年来,对于兴趣度与关联规则挖掘的研究可分成四大类。第一类是使用相关系数的兴趣度方法,这种方法主要基于频率,并且依据关联程度反映特定规则的兴趣。第二类是使用基于统计方案的兴趣度方法,该方法通过随机方法或估计方法来解决合理兴趣度估计的问题。第三类是使用基于模式识别的兴趣度方法,该类方法基于经验模式的判断法来进行兴趣度.evalution。第四类是使用基于文件数的兴趣度方法,该类方法挖掘出的关联规则数量比第三类方法少,但是估计的关联规则往往具有更高的兴趣度。 综上所述,将兴趣度引入到关联规则挖掘中可以使得挖掘出的规则更具有实际意义和可操作性。为进一步深化这一研究,可以结合大数据技术,从多个维度分析和优化规则挖掘,挖掘更加有用的关联规则,促进科学研究、商业分析和公共管理等领域的进步。