预览加载中,请您耐心等待几秒...
1/7
2/7
3/7
4/7
5/7
6/7
7/7

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

DataMining 课程编号170309006 学时:32学分:2.0 适用对象:本科计算机类学生 先修课程:《数据库原理》.《概率论与数理统计》.《高级程序设计语言》.《数据结构》 一、课程的性质和任务 该课程可以支撑毕业要求第1.2.4.5条的达成。数据挖掘是计算机科学与技术专业的选 修课程,本课程以数据挖掘为主要内容,讲述实现数据挖掘的各主要功能.挖掘算法和应用, 并通过对实际数据的分析更加深入地理解常用的数据挖掘模型。数据挖掘是20世纪末刚刚 兴起的数据智能分析技术,由于有广阔的应用前景而备受重视。数据挖掘作为一门新兴的学 科,在它的形成和发展过程中表现出了强大的生命力,广大从事数据库应用与决策支持,以 及数据分析等学科的科研工作者和工程技术人员迫切需要了解和掌握它。数据挖掘涉及的内 容较为广泛,已成为迅速发展并在信息社会中广泛应用的一门综合性学科。本课程主要学习 的内容包括数据预处理.分类与预测.聚类分析等内容。 二、教学目的与要求 通过课程学习,重点掌握数据挖掘技术如何挖掘数据中的有用知识;理解数据挖掘的内 涵.作用和相关技术的主要内容;了解各种相关算法和技术的具体运用。 三、课程的主要教学内容和教学方法 第一章数据挖掘概述 1.基本内容: 什么是数据挖掘 数据挖掘(DataMining)就是从大量的.不完全的.模糊的.随机的实际应用数据中,提取 隐含在其中的.事先不知道的但又是潜在有用的信息和知识的过程。 数据挖掘——在何种数据上进行? 关系数据库.数据仓库.事务数据库 数据挖掘功能——可以挖掘什么类型的模式 关联分析.分类和预测.聚类分析 数据挖掘系统的分类 .区 分.关联.聚类.局外者.趋势和演化分析.偏差分析.类似性分析等分类。 理解和掌握数据挖掘的基本概念.数据挖掘过程以及数据挖掘功能。 了解数据挖掘的应用和面临的问题。 对数据挖掘能够解决的问题和解决问题思路有清晰的认识。 3.教学重点难点: 关联分析.分类和聚类。 4.教学建议 讲授课程内容与时俱进.结合实际;鼓励学生积极思考。同时本课程在职业发展与规划 部分利用实践教学基地的企业资源,请企业高级工程师讲解行业发展.职业人才需求。 5.教学方法: 讲授法.提问法.课堂讨论法 6.与毕业要求的对应关系: 对应理工类本科毕业生要求第5项,运用现代计算机技术培养学生数据处理和分析的能 力。 第二章数据仓库与OLAP 1.教学内容: 数据仓库:数据仓库是一个面向主题的.集成的.时变的.非易失的数据集合,支持管理决 策制定。这个简短.全面的定义指出了数据仓库的主要特征。四个关键词,面向主题的.集成 的.时变的.非易失的,将数据仓库与其它数据存储系统(如,关系数据库系统.事务处理系统. 和文件系统)相区别。 多维数据模型:星形模式.雪花模式.事实星座模式 数据仓库的系统结构和实现:数据仓库的设计步骤和结构.三层数据仓库结构.OLAP服 务器类型 由数据仓库到数据挖掘:数据仓库的使用.由联机分析处理到联机分析挖掘。 2.教学要求: 了解数据集市.数据仓库的基本内涵。 掌握数据仓库的实现方法,包括如何建立多维数据模型。 了解数据仓库系统的结构。 OLAP的典型操作,并能根据实际问题进行OLAP操作。 教学重点难点: 重点:数据仓库。 难点:多维数据模型。 4.教学建议 讲授课程内容与时俱进.结合实际;鼓励学生积极思考。同时本课程在职业发展与规划 部分利用实践教学基地的企业资源,请企业高级工程师讲解行业发展.职业人才需求。 5.教学方法: 讲授法.提问法.课堂讨论法 6.与毕业要求的对应关系: 为后续课程的学习打下坚实基础。培养学生计算思维和用计算机解决问题的能力。 第三章数据预处理 1.教学内容: 数据清理:遗漏值.噪音数据 数据集成和变换:数据集成.数据变换 数据方聚集:聚集操作用于数据方中的数据。 维归约:可以检测并删除不相关.弱相关或冗余的属性或维。 数据压缩:使用编码机制压缩数据集。 数值压缩:用替代的.较小的数据表示替换或估计数据,如参数模型(只需要存放模型 参数,而不是实际数据)或非参数方法,如聚类.选样和使用直方图。 离散化和概念分层产生:数值数据的离散化和概念分层产生.分类数据的概念分层产生。 2.教学要求: 了解数据预处理的目的和意义。 掌握如何读取不同数据源的数据。 掌握如何对数据进行清理。 掌握如何对不同数据源的数据进行合并。 掌握如何对数据进行变换,使之适合建模的需要。 掌握如何对数据进行消减,使得在消减后的数据集上挖掘更有效。 了解目前数据预处理发展及研究动态。 3.教学