预览加载中,请您耐心等待几秒...
1/5
2/5
3/5
4/5
5/5

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

大数据挖掘原理实践(TheoreticalPracticeofBigDataMining)课程代码:7251085学分:1学时:16(其中:课程教学学时:0,课程实践学时:16)先修课程:《数据库原理》、《概率论与数理统计》适用专业:计算机科学与技术教材:DavidHand,HeikkiMannila,PadhraicSmyth著,张银奎、廖丽、宋俊等译,《数据挖掘原理》,机械工业出版社,2003开课学院:计算机与软件学院一、课程性质与课程目标(-)课程性质大数据挖掘原理实践是计算机类专业的算法实现及应用课程。课程实践的主要内容:分别完成关联规那么挖掘系统、支持向量机分类系统以及数据聚类系统的设计和实现。该门课程通过实践环节,使学生在了解大数据挖掘课程理论基础上,深入掌握大数据挖掘的原理。使用理论课的基础知识的方法及步骤,进一步加深对大数据挖掘有关概念和理论的理解,并且使学生能够提高运用大数据挖掘解决实际问题的能力,并为毕业设计做准备。(二)课程目标课程目标包括知识目标和能力目标,具体如下:课程目标1:通过对相关问题的分析,选取合适的数据挖掘方法,通过系统实现及公共数据集得到相关的测试结果,并能对测试结果进行分析和有效性比拟。课程目标2:通过对算法在公共数据集上的测试结果比拟,能够分析算法的优点和局限性。(三)课程目标与专业毕业要求指标点的对应关系本课程支撑专业培养计划中的毕业要求指标点4.4和5.3。毕业要求指标点44针对设计或开发的解决方案,能够通过理论证明、实验仿真或者系统实现等多种科学方法说明其有效性和合理性,并对解决方案的实施质量进行分析,通过信息综合得到合理有效的结论。毕业要求指标点5.3:能够分析复杂工程问题所使用的技术、资源和工具的优势和缺乏,理解其局限性。毕业要求输点、课程目标1课程目标2毕业要求4.4毕业要求5.3二、本课程开设的实验工程编号实验工程名称学时类型要求支撑的课程目标1关联规那么挖掘系统4综合性必做课程目标1,22支持向量机分类系统6综合性必做课程目标13数据聚类系统6综合性必做课程目标1,2实验1:关联规那么挖掘系统1.实验目的及要求1)掌握PythonGUI编程;2)理解关联规那么挖掘原理及实现方法;3)所有操作要求通过用户界面实现;4)关联规那么挖掘算法要求可从两种经典算法Apriori或FP-Growth中任意选取;5)可自行设置最小支持度计数和最小置信度参数值;6)输出:各个频繁项集、强关联规那么;7)课堂上提交系统代码并阐述设计思路。.实验主要内容自学PythonGUI编程,设计并实现一个基于GUI的关联规那么挖掘系统。.重难点1)重点算法的实现方法。2)难点图形用户界面设计。实验2:支持向量机分类系统1.实验目的及要求1)理解支持向量机的原理;2)运用支持向量机解决分类问题;3)训练过程采用K-交叉验证法选取最优参数组合;4)训练过程中可自行设置参数值及SVM参数的取值范围;5)要求输出:最正确参数组合值、分类准确率、虚警率、ROC曲线、AUC值;6)撰写完整的科技报告表述自己的算法设计、算法实现与算法评估过程,报告的内容包括任务描述、问题分析、算法设计、算法实现以及程序运行结果及分析;7)提交源程序工程文件和课程设计报告。.实验主要内容自学PythonGUI编程,设计并实现一个基于GUI的支持向量机分类系统。。.重难点1)重点算法的实现方法。2)难点使用K-交叉验证法选取最优参数。实验3:数据聚类系统.实验目的及要求1)理解并掌握各种数据聚类算法;2)灵活运用所学聚类方法解决实际问题;3)可自行选取聚类算法;4)不同的聚类算法要求使用不同的操作界面;5)可自行设置参数值;6)撰写完整的科技报告表述自己的算法设计、算法实现与算法评估过程,报告的内容包括任务描述、问题分析、算法设计、算法实现以及程序运行结果及分析;7)提交源程序工程文件和课程设计报告。.实验主要内容分别使用K-means聚类算法和K-中心点聚类算法实现数据的聚类操作。.重难点1)重点图形用户界面设计。2)难点对不同的应用选取最正确距离度量函数。注:本课程为学科专业选修课,授课对象为大三的学生,实验类型主要是综合性实验,最终提交的课程实践报告主要包括数据关联规那么算法应用、支持向量机分类算法和聚类算法应用。三、课程考核本课程采用考勤、实验完成情况与课程报告相结合的方式进行评价,成绩评定采用百分制,其中考勤成绩占比20%,系统演示成绩占比40%,课程报告成绩占比40%o考勤成绩评价方式、实验完成情况评价方式和课程报告评价方式如表1所示。表1课程实践评价方法类别所占比例级别评分规那么考勤20%优满勤良缺勤1次中缺勤2次及格缺勤3次不及格缺勤次>3次系统演示情况40%优能够按照GUI设计方案开发,系统功能完全实现。良能够按照