预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

《中国教育信息化鳊辑部:mis@moe.edu.cn够舞劂基于关联规则挖掘的高职院校计算机专业课程设置陈霄.曾振东(广东青年职业学院,广东广州510507)摘要:关联规则挖掘是挖掘研究领域的一项重要技术,高职院校教学管理系统产生海量数据,这些数据中隐藏着大量有价值的信息。文章采用改进的Apriori算法对高职院校计算机专业学生成绩进行关联规则分析,挖掘出课程之间的相关性,为高职院校更科学的制定教学计划提供有力的决策支持,进而提高教育教学质量关键词:关联规则;高职院校;计算机专业中图分类号:TP393文献标志码:A文章编号:1673—8454(2O14)20—0075-03引言识的过程。_1]关联规则挖掘是从大量数据中挖掘出有价一、随着高职院校快速发展,规模不断扩大.造成高职值的、描述数据项之间相互联系的有关知识。[21关联规则院校在课程设置、教学内容、学生管理、招生就业等方面是数据挖掘研究领域的一项重要技术,其目的是从数据面临严峻的考验。传统的教学管理理念已经不能够适应库中挖掘出不低于预先给定min—support阈值和min—高职院校发展的需要,但是,许多高职院校在专业课程eonfi阈值的关联规则。[≈设置上都是在以往的专业课程设置基础上结合教学实关联规则描述为:设I={i1,i。,……,i}为M个项目集,际情况简单的进行修改,很少高职院校在专业课程设置D为交易数据集合,其中事务T是I项目子集(TI),对上听取企业的建议或者遵循市场对人才的需求,导致课应的每一个事务交易都有唯一的标识TID。关联规则形程应该在哪个学期开设或者是否继续开设等方面存在如XY的逻辑蕴涵式,其中XcI,YcI,且Xny=qb。不少问题。如果事务数据库D中有s%的事务包含XUY,则称关联目前,基本上所有的高职院校都是采用基于WEB规则XY的支持度为s%.若项集X的支持度记为的教学管理系统对学生成绩信息进行有效管理.随着时support(X),规则的信任度为support(XUY)/support间的推移,教学管理系统将产生海量的数据,大量的数(X)。嗍也就是:据没有被充分的利用,因此,如何利用关联规则挖掘技support(XY)=P(XUY)术发掘隐藏在海量学生成绩数据背后有价值的信息或confidence(XY)=P(Y/X)者规则,如课程之间的联系,学生成绩与课程之间的联2.Apfiod算法系等等,为教师授课、学生学习、教育管理决策提供有用Apfiofi算法是关联规则挖掘中重要的算法之一,它的理论指导。的核心思想是采用逐层搜索的迭代的方法通过多次扫二、关联规则挖掘和改进的Apriori算法描数据库D来找出所有的频繁项集。其算法描述如下:1.基本概念L1={频繁1一项集l;数据挖掘fDataMining),就是从大量的、不完全的、For(k=2;Lk一1≠qb;k++)dobegin有噪声的、模糊的、随机的实际应用数据中,提取隐含在Ck=apriorigen(Lk一1);//新的潜在频繁项集—其中的、人们事先不知道的、但又潜在有用的信息和知foralltransactionst∈Ddobegin基金项目:广东省高等职业教育教学改革项目(省财政资助项目)(20130301024)。TheChineseJournalofICTinEducation75《中国教育信息化鳊辑部:mis@moe.edu.cnC=subset(Ck,1);//事务t中包含的潜在频繁项集表1数据筛选后的学生成绩表forallcandidatesC∈CtdoC.count++;学号图像网页动画网站制作C语言end;处理设计制作与维护程序设计Lk={C∈CKIc.count≥minsup1end;110120019650906056Answer=YkLk;Apriori算法虽然简单明了,容易实现,但是存在许110120028765866464多不足之处。一是对数据库D扫描次数过多,二是会产11O120035682508386生大量的中间项集。针对这两个问题,笔者对Apriori算法做了相应的改进,将整个数据库进行分段,挖掘过程11O120047893799690只需在段内进行,接着各子数据库挖掘结果汇总,最终11O120058576827578刷选出关联规则。三、关联规则挖掘在高职院校计算机专业课程设置中的应用每名学生每门课的成绩值落入到特定的区间,最终转换高职院校计算机专业课程包括有图像处理、网页设成离散属性。因此。本文将学生各门课程成绩分为优秀、计、动画制作、网站制作与维护、C语言程序设计等。采良好、中、及格、差五等,分别用A、B、C、D、E表示,90—用改进的Apriori算法对计算机专业课程进行分析.分100分为A类,80—89分为B类,70—79分为C类,60—69析流程包