预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于约束的闭序列模式挖掘算法的研究现有的闭序列模式挖掘算法都能有效地挖掘闭序列模式。然而,随着应用领域的细化,用户对挖掘出来的结果有了更高的要求。因此,将用户的要求或兴趣转化成一种或多种约束推进到闭序列模式挖掘过程中,来限定挖掘的闭序列模式是序列模式挖掘领域的一个研究重点。本文针对这些问题,将研究重点放在基于约束的闭序列模式挖掘算法的研究上,这些研究问题在顾客购买行为分析,Web访问模式分析,DNA序列分析等领域都有广泛的应用。首先,提出一种基于时间约束的闭序列模式挖掘算法。该算法把时间约束推进到闭序列模式挖掘过程中,在模式增长框架下使用se时间和timeline的概念在前缀模式的投影数据库中挖掘具有时间约束的闭序列模式。另外,该算法使用了BIDE算法的双向扩展的闭检测技术来挖掘闭序列模式。在挖掘大型数据库时,该算法的性能优于CTSP算法。其次,提出一种基于规则表达式约束的闭序列模式挖掘算法。此算法把规则表达式作为用户的要求推进到闭序列模式挖掘过程中,实现了交互式挖掘。使用主存索引方法挖掘序列模式,利用hash表进行闭检测。该算法能够有效地挖掘闭序列模式并且能够满足用户的要求。最后,提出一种基于规则表达式约束的加权闭序列模式挖掘算法。该算法把权值约束和规则表达式约束推进到闭序列模式挖掘过程中。采用主存索引方法,计算每个序列的最小加权支持计数,找到满足最小加权支持计数的序列模式,然后利用hash表进行加权序列模式的闭检测,提高了挖掘效率,其性能优于WCSpan算法。实验结果表明,本文所提出的算法都能有效地解决各自问题,明显地优于现有的同类算法,实现了预期的研究目标。