预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

数据挖掘一课程基本信息课程编号学分3学时51开课学期三年级春季学期课程名称数据挖掘DataMining课程定位数据挖掘是信息管理与信息管理专业的选修课。通过该课程的学习,使学生对数据仓库、数据挖掘八多维分析的相关基础知识有一定的了解,并对较为成熟的技术和方法具有相应的应用分析能力。引导学生对数据挖掘产生兴趣,并且逐渐培养学生的数据意识,并为以后深入学习大数据理论及应用打下必要的基础。课程简介数据挖掘是在大量数据中寻找有意义或有价值信息的过程。为了将数据转化为知识,需要利用数据仓库、联机分析处理(OLAP)工具和数据挖掘等技术。本课程将介绍这三方面技术背景,并通过一系列实验综合运用这些技术。教学要求数据挖掘通常又称为数据中的知识发现,是从数据海洋中发现隐臧的知识模式。课程通过数据仓库、OLAP、数据挖掘的应用实例来解释它们的原理、概念和技术,使学生明白数据挖掘常用算法的主要功能和应用场景,为今后数据分析打下基础。教学特色.算法主线:教学过程以数据挖掘算法为主线展开,对每一个算法能解决的问题进行展示,并给出问题让学生实践。.注重实践环节,培养学生自我学习能力及运用能力。课程类型口数学与自然科学基础课口专业基础课口专业核心课0专业选修课口实践课教学方式(单项选择)0讲授为主口实验/实践为主口专题讨论为主口案例教学为主口自学为主口其它(为主)授课语言(单项选择)口中文口中文+英文(英文授课比例—%)口英文口其它外语考核方式(单项选择)口考试口考查口考试+考查成绩评定1标准平时(30%)+期末上机考试(70%)教材及主要参考资料采用教材:[1]翁敬农等译,《数据挖掘教程》,清华大学出版社⑵ZhaohuiTang等著,《数据挖掘原理与应用》清华大学出版社教学参考:陈文伟主编,《数据仓库与数据挖掘教程》,清华大学出版社先修课程数据库原理适用专业信息管理与信息系统二、教学内容与要求第1章导论数据仓库、数据挖掘的基本概念第2章数据挖掘初步数据挖掘的定义、分类,数据挖掘例如第3章数据挖掘深入判断问题的类型,输入输出属性分析,挖掘模型评估第4章基本数据挖掘技术决策树、关联规那么、K-平均值算法、遗传算法的工作原理第5章信息论信息论原理、ID3算法第6章数据仓库原理数据仓库结构、数据仓库的数据模型、数据抽取、转换和装载、元数据三实验内容实验名称1在iDA中用ESX数据挖掘工具进行挖掘实验目的:学会在iDA中利用ESX通过无监督聚类和有监督学习进行数据挖掘。无监督的聚类是指一种利用没有预定义的类的数据建立模型的数据挖掘方法。有监督的学习是指利用有明确目的的数据实例建立分类模型的过程。实验内容:利用ESX通过无监督聚类和有监督学习进行数据挖掘,解读分析结果。实验环境:EXCEL实验评测:功能的正确性实验名称2在iDA中用ESX数据挖掘工具进行KDD实践实验目的:了解知识发现过程,通过无指导聚类来判断输入属性是否能够区分输出属性的值以及参数在知识发现中的作用实验内容:属性评估、参数评估实验环境:MSSQLServer2005以上实验评测:功能的正确性实验名称3在iDA中用神经网络方法来进行数据挖掘实验目的:了解神经网络工作原理,并在iDA中进行挖掘实验实验内容:在iDA中用BP神经网络方法通过有监督学习进行数据挖掘;并学会用Kohonen无监督神经网络进行聚类。实验环境:EXCEL实验评测:功能的正确性实验名称4决策树与聚类实验目的:使用SQLSever自带的决策树算法以及聚类算法进行数据挖掘实验内容:创立模型、调整参数,数据分析实验环境:MSSQLServer2005+VisualStudio2005以上实验评测:模型的正确性,理解的合理性实验名称5关联与贝叶斯实验目的:使用SQLSever自带的关联规那么算法以及贝叶斯算法进行数据挖掘实验内容:贝叶斯与决策树的算法差异;创立模型,数据分析实验环境:MSSQLServer2005+VisualStudio2005以上实验评测:模型的正确性,理解的合理性实验名称6时间序列模型与序列聚类模型实验目的:使用SQLSever自带的时间序列模型与序列聚类模型算法进行数据挖掘实验内容:创立模型、调整参数,数据分析实验环境:MSSQLServer2005+VisualStudio2005以上实验评测:模型的正确性,理解的合理性实验名称7联机分析处理OLAP实验目的:掌握OLAP模型,并通过OLAP模型进行多维数据分析实验内容:创立模型、创立数据源视图、维度创立及调整、多维数据集操作,数据分析实验环境:MSSQLServer2005+VisualStudio2005以上实验评测:模型的正确性,理解的合理性实验名称8多维数据分析在EXCEL中的应用实验目的:掌握多维数据集在EXCEL中的应用方法实验内容:在EXCEL中进行