预览加载中,请您耐心等待几秒...
1/4
2/4
3/4
4/4

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

《数据挖掘实践》教学大纲 课程英文名Dataminingpractice课程代码 学分1总学时1周课程类别集中实践环节 先修课程数据挖掘课程性质任选 适用专业信息与计算科学、数学与应用数学开课学院理学院 一、课程地位与目标 (一)课程地位 《数据挖掘实践》是学生在学习完《《数据挖掘》课程后,利用完成一个完成项目的方式 巩固学到的数据挖掘方法,掌握实践数据挖掘项目开发的基本方法和流程,为进一步提高实 践能力打下坚实的基础。 (二)课程目标 1.掌握数据挖掘项目的基本流程和方法; 2.提高学生的动手实践能力。 二、课程目标与相关毕业要求的对应关系 课程目标对毕业要求的支撑程度(H、M、L) 课程目标 毕业要求4毕业要求6毕业要求10 课程目标1HMM 课程目标2HMM 注:1.支撑强度分别填写H、M或L(其中H表示支撑程度高、M为中等、L为低)。 三、设计选题及任务要求 序号参考选题任务与要求 1.掌握HBase基本操作 HBase基本操作 12.掌握Hive基本操作 Hive基本操作 四、课程设计的主要进程与时间安排 序号主要进程教学内容时间分配 1HBase表的创建Hbase的JavaAPI操作之创建删除表第1天 Hbase的比较过滤器RowFilter的使用第2天 2HBase过滤器 Hbase专用过滤器PageFilter的使用 3HBase文件读写从Hbase中读取数据写入hdfs中第3天 4Hive计算Hive通过日期计算星座实例第4天 5Hive与数据库HiveJDBC实例第5天 注:进程安排的最少时间为0.5天。 五、课程考核与成绩评定 考核类别考查 考核形式考勤+项目 成绩评定考勤20%,项目80% 成绩登记方式五级制 六、推荐教材与主要参考书 (一)推荐教材: 1.Hadoop大数据开发案例教程与项目实战,时允田,林雪纲编,人民邮电出版社,2017.5 2.Hadoop与大数据挖掘,张良均等编,机械工业出版社,2017.5 3.大数据挖掘:系统方法与实例分析,周英,卓金武编,机械工业出版社,2016.5 (二)主要参考书: 1.HBase实战,NickDimiduk,AmandeepKhurana著,谢磊译,人民邮电出版社,2013.9 2.Hive编程指南,EdwardCapriolo等著,曹坤译,人民邮电出版社,2013.12 《Hadoop大数据分析实践》教学大纲 课程英文名PracticeofBigDataAnalysisonHadoop课程代码 学分1总学时1周课程类别集中实践环节 先修课程Hadoop大数据分析基础课程性质任选 适用专业信息与计算科学、数学与应用数学开课学院理学院 一、课程地位与目标 (一)课程地位 《Hadoop大数据分析实践》是学生经过《《Hadoop大数据分析基础》课程学习后,进一 步加强在大数据计算平台Spark和流式计算平台Storm进行大数据分析算法的设计、分析和 实现能力。 (二)课程目标 1.利用大数据计算平台,通过编程实现给定的大数据分析任务; 2.提高学生的程序设计能力。 二、课程目标与相关毕业要求的对应关系 课程目标对毕业要求的支撑程度(H、M、L) 课程目标 毕业要求4毕业要求6毕业要求10 课程目标1HMM 课程目标2HMM 注:1.支撑强度分别填写H、M或L(其中H表示支撑程度高、M为中等、L为低)。 三、设计选题及任务要求 序号参考选题任务与要求 1互联网电影智能推荐 1.根据问题要求建立适当的分析模型并求 2电商产品评论数据情感分析 解 3航空公司客户价值分析 2.进行项目展示,分析评价自己的实现 4基站定位数据商圈分析 注:学生可任选其中一个题目进行设计。 四、课程设计的主要进程与时间安排 序号主要进程教学内容时间分配 1背景与挖掘目标搜集相关背景数据并分析第1天 2分析方法与过程分析问题建立适当的分析模型第2天 3算法设计与实现选择或设计合适的分析算法第3天 4调试程序设计与调试第4天 5展示展示项目成果第5天 注:进程安排的最少时间为0.5天。 五、课程考核与成绩评定 考核类别考查 考核形式考勤+项目实现 成绩评定考勤20%;项目80% 成绩登记方式五级制 六、推荐教材与主要参考书 (一)推荐教材: 1.大数据分析原理与实践,王宏志著,机械工业出版社,2017.7,第1版。 2.实时大数据分析:基于Storm、Spark技术的实时应用,SumitGupta,ShilpiSaxena著, 张广骏译,清华大学出版社,2018.1 (二)主要参考书: 1.Spark高级数据分析,SandyRyza等著,龚少成译,人民邮电出版社,2015.11 2.Storm分布式实时计