预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

InformationTechnology信息科技 数据挖掘技术的应用初探 章慧云 江西省水利水电学校,江西南昌330013 摘要随着计算机技术的高速发展,互联网技术的风靡,从网上获得相关资料已经非常方便。同时,人们积累的数据 也越来越多,越来越烦杂,面对庞大而广泛的数据信息,简单的汇总已经无法解决数据分析任务了。为此,一种高端的、 智能化的分析和处理大量数据信息的技术应运而生,这就是目前最热门的技术“数据挖掘”,本文将从数据挖掘的概念入手, 一步步解析数据挖掘技术。 关键词数据挖掘;关联分析;聚类分析 中图分类号TP311.13文献标识码A文章编号1674-6708(2010)33-0257-02 1数据挖掘的概念3数据挖掘的流程 随着计算机技术的高速发展,互联网技术的风靡,获得相关3.1定义目标 资料已经是很方便了。但是人们也积累了大量的数据信息,面对 为了避免数据挖掘的盲目性,首先就必须清晰地定义出业务 这些庞大的数据,如何从中提取有用的信息成为当务之急,为此, 问题,确定数据挖掘的目标。挖掘的目标明确了,但结果是不可 数据挖掘技术应运而生。数据挖掘(DataMining)是从大量的、 预测的。 不完全的、有噪声的、模糊的、随机的数据中提取隐含在其中的, 人们事先不知道的,但又是潜在有用的信息和知识的过程。数据3.2数据准备 挖掘是发现知识的关键步骤。1)数据选择。在大型数据库和数据仓库目标中搜索有关的内、 2数据挖掘的作用外部数据信息,提取适用于数据挖掘的数据; 2)数据预处理。研究数据信息,进行数据的加工、集成等, 2.1关联分析去除重复的数据信息,选择要进行数据挖掘的数据,并定义数据 关联是反映两个或者两个以上事件之间存在某种依赖或联系类型; 规律性。关联规则挖掘是由RakeshApwal提出来的。在数据库中,3)数据转换。数据转换决定数据挖掘能否成功,数据转换就 如果存在一项或多项之间的关联,则其中一项属性值能够依据其是将数据转换成一个针对挖掘算法的模型。 他属性值进行推测。关联分为简单关联、时序关联和因果关联。3.3数据挖掘 关联分析的目的是找出数据库中所有频繁项目集,这是数据挖掘 根据数据功能的类型和数据的特点完善和选择合适的挖掘算 中最成熟的技术之一。例如:每天购买洗发水的人也有可能购买 法,对所得到的经过转换的数据进行数据挖掘。 肥皂,比重有多大。 3.4结果分析 2.2聚类分析 解释和评估数据挖掘的结果,最终转换成用户能够理解的知 聚类分析是把数据按照所选样本的关联相似性划分成若干小 识。 组,同一小组中的数据具有较高的相似度,不同组中的数据则相异, 即同组中的相似性尽可能大,而组别间的相似性尽可能小。聚类3.5知识的同化 事先不知道组别数和各组的相似特性。聚类分析可以发现数据的将分析所得到的知识集成到业务信息系统的组织结构中去。 分布模式,以及可能的数据属性之间的相互关系。例如:将学生4数据挖掘的应用 分为成绩优秀的学生,成绩中等的学生,成绩差的学生。 4.1数据挖掘技术在市场营销中的应用 2.3分类 数据挖掘技术普遍应用于市场营销中,假定“以往消费者的 分类就是按照以前数据库中的数据,分析它们的属性、特征, 行为是未来消费者的消费理念的直接解释”,以市场营销学的市场 找出一个类别的概念描述,并利用这种描述构造模型,每个类别 细化原理为基础。通过收集、整理消费者以往的消费信息为数据 都代表了本类数据的整体信息,一般用规则或决策树模式表示。 信息,总结消费者的特点及兴趣爱好,根据不同的属性分类,推 分类事先知道类别数和各类的典型特征。例如:学校根据以前的 测出类似消费群体的消费行为,对不同类的消费群体进行定向营 数据将教师分成了不同的类别,现在就可以根据这些来区分新教 销,这样降低了营销的盲目性,节省了营销成本,提高了营销效率, 师,以采取不同的待遇分配方案。 为企业创造出更多的利润。 2.4预测在经济发达国家和地区,许多企业都利用数据挖掘技术对数 预测是利用历史和当前的数据找出变化规律,推测未来数据据信息进行加工处理,针对不同的消费群体,发出不同的营销材料, 的种类及特征。预测是以时间为关键属性的关联规则。例如:对以突出自己的竞争优势,扩大产品的营业额。 未来经济形势的判断。4.2数据挖掘技术在商业银行中的应用 2.5偏差分析数据挖掘技术广泛应用于金融界,金融事务搜索大量的数据 数据库中的数据存在很多异常情况,偏差是对差异和极端情信息,对这些数据进行加工处理,发现其特征,从而发现不同类 况的描述,发现数据库中数据偏离常规的异常现象,揭示内在原因。别客户的特点,评估其信誉,推测其需求。商业银行所作业务的 例如:在本次数学测试中有30%的同学不及格,教师为了提高教利润与风险是并存的,为了保证最大