预览加载中,请您耐心等待几秒...
1/5
2/5
3/5
4/5
5/5

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

数据挖掘的模式类型及其应用领域 发表时间:2009-11-25HYPERLINK"http://www.e-works.net.cn/commsearch.aspx?author=%d1%a6%cf%f2%d1%f4"\t"_blank"薛向阳来源:万方数据 关键字:HYPERLINK"http://www.e-works.net.cn/commsearch.aspx?keyword=%ca%fd%be%dd%cd%da%be%f2"\t"_blank"数据挖掘HYPERLINK"http://www.e-works.net.cn/commsearch.aspx?keyword=%c4%a3%ca%bd%c0%e0%d0%cd"\t"_blank"模式类型HYPERLINK"http://www.e-works.net.cn/commsearch.aspx?keyword=BI+"\t"_blank"BI HYPERLINK"http://www.e-works.net.cn/campaign/indexq.aspx?jobid=83"\t"_blank"信息化应用调查HYPERLINK"http://www.e-works.net.cn/comm/ewk_business/myeworks/my-advice.aspx?title=数据挖掘的模式类型及其应用领域"\t"_blank"我要找茬HYPERLINK"http://community.e-works.net.cn/ewk_business/myeworks/webpost.aspx"在线投稿HYPERLINK"http://www.e-works.net.cn/comm/ewk_business/myeworks/my-favorites2.aspx?htmlurl=/Articles/BI/Article73701.htm&type=viewarticle"加入收藏HYPERLINK"http://www.e-works.net.cn/comment.aspx?htmlurl=/Articles/BI/Article73701.htm&article_id=73701&action=0"发表评论HYPERLINK"mailto:好友信箱?subject=好文章:http://www.e-works.net.cn/Articles/BI/Article73701.htm"好文推荐HYPERLINK"javascript:print()"打印文本 本文阐述了数据挖掘的概念、模式类型及其应用领域.目的在于使人能够根据其所在领域的挖掘任务选择具体的挖掘模式。 一、引言 随着数据库技术的成熟和数据库管理系统的广泛应用,人们已经在商业、政府和科学等领域的数据库内积累r大量历史数据,激增的数据背后隐藏着许多重要的信息,然而过去由于缺乏挖掘数据背后隐藏知识的手段,导致r“数据丰富,但信息贫乏”的现象,即所渭“数据爆炸”。面对浩森无际的数据海洋.人们希望能够对数据进行更高层次的分析,以便更好地理解和利用这些数据背后所包含的信息,数据挖掘(DataMining,DM)便应运而生了,这里所指的“知识”就是数据中隐含的信息。数据挖掘就是从大量的、不完全的、有噪声的、模糊的和随机的数据中。提取隐含在其中的、人们事先不知道的,但又是潜在有用的信息和知识的过程。近年来,国内的数据挖掘研究也正逐渐掀起高潮,在算法和应用方而取得了一些具有扩展性或突破性的研究成果。 二、数据挖掘的模式类型 由于每种数据挖掘技术都有其自身的特点和实现的步骤,对数据的形式有具体的要求,冈此,成功的应用数据挖掘技术以达到日标,这个过程奉身就是一件很复杂的事情,下面主要从挖掘任务这个角度来讨论对具体挖掘模式的选择。根据挖掘任务,数据挖掘可分为概念/类描述;挖掘频繁模式、关联和相关;分类和颅测;聚类分析;离群点分析和演变分析等。在选择使用某种数据挖掘技术之前,首先要将待解决的商业|’日J题转化成止确的数据挖掘任务,然后根据挖掘任务来选择具体使用某一种或几种挖掘模式。F面具体地分析每一种挖掘任务应使用哪些挖掘模式: 1.概念/类描述 用汇总的、简洁的和精确的方式描述各个类和概念可能是有用的。这种类或概念的描述称为概念/类描述。这种描述可以通过下述方法得到:(1)数据特征化,一般地汇总所研究类的数据;(2)数据区分,将日标类与一个或多个可比较类进行比较;(3)数据特征化和比较。 2.挖掘频繁模式、关联和相关 频繁模式足在数据中频繁出现的模式。存在多种类型的频繁模式,包括项集、子序列和f结构。频繁项集是指频繁地在事物数据集中一起出现的项的集合,如牛奶和面包。频繁m现