预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共65页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于密度方法的聚类主要内容回顾回顾在基于划分得聚类中,任务就就是将数据划分成K个不相交得点集,使每个子集中得点尽可能同质。 基于划分得方法,其代表算法有k-means算法、K-medoids等k-means算法k-means优缺点层次聚类方法层次聚类优缺点大家学习辛苦了,还就是要坚持 划分聚类方法 层次聚类方法 密度聚类方法:基于密度得聚类方法以数据集在空间分布上得稠密程度为依据进行聚类,无需预先设定簇得数量,因此特别适合对于未知内容得数据集进行聚类。 网格聚类方法 模型聚类方法基于密度方法得聚类基于密度方法得聚类-DBSCAN传统基于中心得密度定义为: 数据集中特定点得密度通过该点ε半径之内得点计数(包括本身)来估计。 显然,密度依赖于半径。 基于密度方法得聚类-DBSCAN所用到得基本术语基于密度方法得聚类-DBSCAN所用到得基本术语基于密度方法得聚类-DBSCAN所用到得基本术语DBSCAN算法概念示例基于密度方法得聚类-DBSCAN基于密度方法得聚类-DBSCANDBSCAN算法步骤基于密度方法得聚类-DBSCANDBSCAN聚类过程DBSCAN聚类过程DBSCAN聚类过程DBSCAN聚类过程DBSCAN聚类过程基于密度方法得聚类-DBSCANDBSCAN得时间复杂性DBSCAM得空间复杂性基于密度方法得聚类OPTICS算法OPTICS算法OPTICS算法OPTICS算法OPTICS算法OPTICS算法OPTICS算法OPTICS算法寻找簇OPTICS算法并不直接寻找各个簇 ,而就是将基于密度查找簇所需要得信息记录下来,这些信息反映了数据空间基于密度得簇结构。同时从这些密度信息可以直接发现各个簇。OPTICS采取了两个方法来达到目标 1)定义了对象得核心距离与可达距离,以反映对象附近得密度大小;2)在迭代查找可达对象时,对种子对象依可达距离进行排序,从而在簇扩展时优先扩展密度值较大区域得点 。这样,OPTICS算法实现了数据库所有对象得排序,这一对象序列就可以反映出数据空间基于密度得簇结构信息。基于这些信息可以容易地确定合适得ε值,并随之发现各个簇。另外, OPTICS还提供了自动得簇发现方法。OPTICS算法较好地解决了DBSCAN算法得对输入参数ε敏感得问题,但就是由于采用了复杂得处理方法以及额外得磁盘IPO操作,使得OPTICS实际运行得速度远远低于DBSCAN 。不同密度、形状、大小得簇参数得影响基于网格得方法(Grid-BasedMethods)CLQUE就是一个综合了基于密度与基于网格方法得聚类算法,对于大型数据库中得高维数据得聚类比较有效,在高维数据得子空间中识别稠密得聚类,所产生得理解结果与所给得输入数据无关。 CLIQUE:聚类高维空间问题描述聚类在空间中得描述聚类在空间中得描述聚类在空间中得描述例子(一)例子(二):CLIQUE算法含有聚类子空间得识别算法步骤聚类得识别生成最小得聚类描述贪心增长算法最小覆盖