预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于核函数的聚类算法的研究摘要:核函数聚类通过Mercer核把原来非线性数据空间映射到特征空间,在经典的聚类算法的基础上得到全新的聚类目标函数。传统的核聚类算法收敛速度较慢容易陷入局部最优解。同时离群点是远离其他数据点的数据,但可能包含重要的信息。针对这些问题,本文对已有的核聚类算法模型和应用进行了详细的阐述。关键词:聚类;核函数;离群点Keywords:clustering;kernelfunction;outlier聚类分析在数据挖掘中占有重要地位,它将具有相同特征的对象放在同一个簇中,而不同的聚类在不同的簇中。现有的聚类分析方法有:基于密度的方法[1]、基于模型的方法[2]、基于划分的方法[3]和基于网络的方法[4]等。较经典的算法是模糊C-均值算法[5],该算法主要对样本特征进行聚类,聚类结果依赖样本点的分布情况,当各类样本线性不可分时,这种算法的聚类效果较差。核聚类算法[6]是将核函数引入聚类之中,通过将输入空间的数据的非线性映射到高维空间,在高维空间进行线性聚类。这样通过映射的数据增加了数据的差异性,扩大了数据的线性可分。核方法主要用的核函数,将原始数据由非线性划分映射到特征空间,在特征空间进行聚类,这样能处理非线性数据。核函数比经典聚类算法性能更优,收敛速度更快。早期核函数主要用于SVM方法[7],核函数分为核Fisher判别分析[8]、核C-均值聚类[9]、核模糊c-均值聚类[10]。本文以核函数方法为基础,介绍核函数的经典算法和核函数在各种算法中的应用。1相关研究1.1核函数2本文对核聚类算法的模型、算法和应用进行了详细的分析,发现在模糊聚类算法中加入PSO算法可以有效的避免聚类分析对数据结构的依赖性,增加算法的收敛性和解决算法易陷入局部最优现象。为每个特征空间加动态权值,能借助权值发现样本集中的离群点。离群模糊聚类算法不仅能发现离群点,又能取得良好的聚类效果。