预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

大数据背景下统计学专业“数据挖掘”课程的教学探讨范彩云摘要:互联网技术、物联网技术、云计算技术的蓬勃发展造就了一个崭新的大数据时代这些变化对统计学专业人才培养模式的变革起到了助推器的作用而数据挖掘作为拓展和提升大数据分析方法与思路的应用型课程被广泛纳入统计学本科专业人才培养方案。本文基于数据挖掘课程的特点结合实际教学经验对统计学本科专业开设数据挖掘课程进行教学探讨以期达到更好的教学效果。关键词:统计学专业;数据挖掘;大数据;教学一、引言通常人们总结大数据有“4V”的特點:Volume(体量大)Variety(多样性)Velocity(速度快)和Value(价值密度低)。从这样大量、多样化的数据中挖掘和发现内在的价值是这个时代带给我们的机遇与挑战同时对数据分析技术的要求也相应提高。传统教学模式并不能适应和满足学生了解数据处理和分析最新技术与方法的迫切需要。对于常常和数据打交道的统计学专业的学生来说更是如此。二、课程教学探讨针对统计学本科专业的学生而言“数据挖掘”课程一般在他们三年级或者四年级所开设他们在前期已经学习完统计学、应用回归分析、多元统计分析、时间序列分析等课程所以在“数据挖掘”课程的教学内容选择上要有所取舍同时把握好难度。不能把“数据挖掘”课程涵盖了的所有内容不加选择地要求学生全部掌握对学生来说是不太现实的需要为统计学专业本科生“个性化定制”教学内容。(1)“数据挖掘”课程的教学应该偏重于应用更注重培养学生解决问题的能力。因此教学目标应该是:使学生树立数据挖掘的思维体系掌握数据挖掘的基本方法提高学生的实际动手能力为在大数据时代进一步学习各种数据处理和定量分析工具打下必要的基础。按照这个目标教学内容应以数据挖掘技术的基本原理讲解为主让学生了解和掌握各种技术和方法的来龙去脉、功能及优缺点;以算法讲解为辅由于有R语言、python等软件学生了解典型的算法能用软件把算法实现对软件的计算结果熟练解读对各种算法的改进和深入研究则不作要求有兴趣的同学可以自行课下探讨。(2)对于已经学过的内容不再详细讲解而是侧重介绍它们在数据挖掘中的功能及综合应用。在新知识的讲解过程中注意和已学过知识的融汇贯通既复习巩固了原来学过的知识同时也无形中降低了新知识的难度。比如在数据挖掘模型评估中把混淆矩阵、ROC曲线、误差平方和等知识点就能和之前学过的内容有机联系起来。(3)结合现实数据让学生由“被动接收”式的学习变为“主动探究”型的学习。在讲解每种方法和技术之后增加一个或几个案例以加强学生对知识的理解。除了充分利用已有的国内外数据资源还可以鼓励学生去搜集自己感兴趣的或者国家及社会大众关注的问题进行研究提升学生学习的成就感。(4)充分考虑前述提到的三点课程内容计划安排见表1。(5)课程的考核方式既要一定的理论性又不能失掉实践应用性所以需要结合平时课堂表现、平时实验项目完成情况和期末考试来综合评定成绩。采取期末闭卷理论考试占50%平时实验项目完成占40%课堂表现占10%这样可以全方位的评价学生的表现。三、教学效果评估经过几轮的教学实践后取得了如下的教学效果:(1)学生对课程的兴趣度在提升课下也会不停地去思考数据挖掘有关的方法和技巧发现问题后会一起交流与讨论。(2)在大学生创新创业项目或者数据分析的有关竞赛中选用数据挖掘方法的人数也越来越多部分同学的成果还能在期刊上正式发表有的同学还能在竞赛中取得优秀的成绩。(3)统计学专业本科生毕业论文的选题中利用数据挖掘有关方法来完成的论文越来越多论文的完成质量也在不断提高。(4)本科毕业生的就业岗位中从事数据挖掘工作的人数有所提高说明满足企业需求技能的人数在增加。继续深造的毕业生选择数据挖掘研究方向的人数也在逐渐增多表明学生的学习兴趣得以激发。教学实践结果表明通过数据挖掘课程的学习可以让学生在掌握理论知识的基础上进一步提升分析问题和解决实际问题的能力。四、结束语数据挖掘是一门新型的多学科交叉的学科知识内容体系不断地发展和更新。目前在大数据背景下开设数据挖掘课程有其现实意义同时对教学是一个挑战需要在教学过程中不断探索和研究引领学生发现数据挖掘方法与传统统计分析方法的区别和共同之处。因此在教学