(完整word版)数据挖掘课后答案.doc
一条****淑淑
亲,该文档总共14页,到这已经超出免费预览范围,如果喜欢就直接下载吧~
相关资料
(完整word版)数据挖掘课后答案.doc
第一章1.6(1)数据特征化是目标类数据的一般特性或特征的汇总。例如,在某商店花费1000元以上的顾客特征的汇总描述是:年龄在40—50岁、有工作和很好的信誉等级。(2)数据区分是将目标类数据对象的一般特性与一个或多个对比类对象的一般特性进行比较。例如,高平均分数的学生的一般特点,可与低平均分数的学生的一般特点进行比较。由此产生的可能是一个相当普遍的描述,如平均分高达75%的学生是大四的计算机科学专业的学生,而平均分低于65%的学生则不是。(3)关联和相关分析是指在给定的频繁项集中寻找相关联的规则。例如,
(完整word版)数据挖掘课后习题(word文档良心出品).doc
(实验项目)DBLP数据集包括100万篇发表在计算机科学会议和杂志上的论文项。在这些项中,很多作者都有合著关系。(a)提出一种方法,挖掘密切相关的(即,经常一起合写文章)合著者关系。解决问题的大致过程:DBLP数据集是一个XML文件,先对XML文件解析,得到一个超过1G的TXT文件,处理文件数据格式,并截取前20000行数据,格式如下图:使用FP-Tree算法,设置支持度为3,得到的满足条件的频繁项集如下图:说明:以上结果只是一部分,由于数据集很庞大,限于篇幅,不便全部展示。(b)根据挖掘结果和本章讨论的
(完整word版)数据仓库与数据挖掘教程(第2版)-陈文伟版课后习题答案(非常全).doc
第一章作业数据库与数据仓库的本质差别是什么?书P2(1)数据库用于事务处理,数据仓库用于决策分析。(2)数据库保持事物处理的当前状态,数据仓库即保存过去的数据又保存当前的数据。(3)数据仓库的数据是大量数据库的集成。(4)对数据库的操作比较明确,操作数量较小。对数据仓库操作不明确,操作数据量大。2.从数据库发展到数据仓库的原因是什么?书P1(1)数据库数据太多,信息贫乏。如何将大量的数据转化为辅助决策信息成为了研究热点。(2)异构环境数据的转换和共享。随着各类数据库产品的增加,异构环境的数据也逐渐增加,如
(完整word版)数据挖掘实验1.doc
《物联网智能信息处理》实验报告学院:计算机科学技术学院专业班级:物联网工程1101学号:2011001557姓名:孙泽东日期:2014年11月25日实验一数据预处理实验(2个学时)一、实验目的:熟悉数据预处理的一般流程,重点掌握异常点检测算法,为进一步挖掘数据做准备。二、实验内容:1.了解数据特点,熟悉2-3种数据集数据格式;2.掌握1种以上异常点检测原理;3.验证某种异常点检测算法;4.分析异常点检测算法检测结果。三、实验要求:在熟悉2-3种数据集数据格式的基础上,选择Dev-C++等开发环境打开异常点
(完整word版)数据挖掘实验4.doc
《物联网智能信息处理》实验报告学院:计算机科学技术学院专业班级:物联网工程1101学号:2011001557姓名:孙泽东日期:2014年11月25日实验四智能决策实验(2个学时)一、实验目的:通过分析一个智能决策应用实例,了解物联网智能决策应用模式,为日后基于物联网数据进行智能决策打下良好基础。二、实验内容:1.了解物联网系统智能决策应用特点与模式;2.根据特定应用分析其智能决策模式;3.总结分析特定应用采用的智能信息处理方法。三、实验要求:在收集、整理某种物联网智能决策应用的基础上,重点分析该应用的数据