预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于粒度层次的数据挖掘分类算法研究的综述报告 近年来,在现实生活中,数据已经非常重要。例如,传感器数据,社交媒体数据,电子商务数据等大规模数据都充满了我们的生活,如何处理提取和挖掘有价值的信息就成为了一项非常重要的工作,数据挖掘便应运而生。数据挖掘作为一种处理从大型数据集中提取信息的自动化技术,主要问题是发现内在的、隐蔽的、先前未知的和实用的信息。在数据挖掘领域,分类问题是其中的一大类问题,研究分类算法成为了数据挖掘领域的研究热点。其中,基于粒度层次的分类算法吸引了越来越多的学术界和实际应用界的眼球。 一、粒度层次 在数据挖掘中,粒度是指数据的分解和抽象能力。粒度大小是显示数据图层次结构的标志。在粒度层次的概念下,交互用数据是被分成不同的层,这些层代表数据的抽象级别。在比较不同粒度层之间的数据时,粗粒度层被认为是抽象层,而细粒度层被认为是具体层。 在粒度层次的框架下,粗层精度少、细层精度高。例如,在数据挖掘中,一个国家的地图可以被分成多个粒度层次。在最高粒度层次中,每个国家都是一个粒度单元。在更低的粒度层次中,这些国家被细分成其它的局部单位,例如省、市、乡镇、社区等不同的结构。 二、基于粒度层次的分类算法 1.模糊分类算法 任何分类问题的目标都是根据一组已知的样本建立分类模型,以使用类所需的属性对未知对象进行分类。模糊分类算法正是建立的这个分类模型。模糊分类算法采用模糊集合进行建模,以此来考虑未知样本和多类样本之间的关系。一般而言,模糊分类算法采用了一些经典的模糊集合运算,例如笛卡尔积、模糊距离等来提高分类精度。 2.神经网络分类算法 对于神经网络分类算法而言,其基于特定的模型,通过对于特定的分类问题进行学习,从而建立特定的分类器或者分类方法。神经网络分类算法既可以进行监督式学习,也可以进行非监督式学习。这个神经网络分类器可以处理训练数据,以计算每个特征与给定类别之间的联系。 3.支持向量机(SVM) 支持向量机是一种非常常见的基于粒度层次的分类算法。支持向量机是基于边界学习的一种方法,包含大量的优化问题和参数调整。其基本思想是在不同的粒度层次下,寻找满足条件的界面,使得具有相同标记的所有样本可以分别分配到这个界面的两个相反的侧面。关于支持向量机的优化,一般使用随机梯度下降来完成全局优化,试图避免过度适应,从而提高模型的泛化能力和预测能力。 三、总结 本文主要介绍了基于粒度层次的数据挖掘分类算法的研究综述。随着我们对于数据越来越深入的研究,分类算法在实践中的应用越来越广泛。本文对于基于粒度层次的三种分类算法进行了简要的介绍,分别是模糊分类算法、神经网络算法和支持向量机。相信读者对于这些分类算法现已初步了解。同时,这些算法之间也存在着很多的联系。对于这些联系,可以开展更深入的研究。