预览加载中,请您耐心等待几秒...
1/5
2/5
3/5
4/5
5/5

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

《数据挖掘技术与应用》实验教学大纲-- 《数据挖掘技术与应用》实验教学大纲 一、课程基本情况 课程代码:1139 课程名称:数据挖掘技术与应用/DataMiningTechnologyandApplication 课程类别:专业必修课 总学分:4 总学时:64 实验/实践学时:20 适用专业:数据科学与大数据技术 适用对象:本科 先修课程:高等数学、线性代数、概率论与数理统计、Python程序设计 二、课程简介 本课程主要讲解了数据挖掘的相关定义,包含数据挖掘中的各种模式的概念和实现方式,用 于了解数据挖掘并能根据所提供的案例完成数据挖掘的各种模式操作。 本课程实验的目标是巩固和扩充课堂讲授的理论知识,培养学生科学实验的基本技能,加强 学生的实践动手能力、创新能力培养,通过实验使学生掌握Pandas编程,掌握机器学习的开发流 程,掌握数据挖掘的基本算法:概率模型、朴素贝叶斯分类、空间向量模型、KNN,在实验中引 导学生注意安全用电,增强学生的环保意识、社会责任意识及安全意识,注重思政教育与专业教 育的有机结合。 三、实验项目及学时安排 序实验实验每组实验对应的课程 实验/实践项目名称 号学时类型人数要求教学目标 1实验一Pandas数据分析实验4验证性1必做2 2实验二回归算法实验2验证性1必做1 3实验三分类算法实验2验证性1必做1 4实验四机器学习的基本使用流程实验6设计性1必做2 5实验五聚类算法实验2验证性1必做4 6实验六推荐算法实验2设计性1必做4 7实验七NLTK实验2综合性1必做4 合计20 四、实验内容 实验一Pandas数据分析实验 实验目的: 1.了解Pandas模块的数据结构 2.使用Pandas对数据进行分析 实验设备: 计算机 《数据挖掘技术与应用》实验教学大纲-- 《数据挖掘技术与应用》实验教学大纲-- OS:Ubuntu16.04 Python:v3.7 实验主要内容及步骤: 1.实验内容 使用Pandas对销售数据进行分析 通过销售数据发现两地销售数据之间是否有关联。 2.实验步骤 (1)查看销售数据集的数据构成。 (2)构建convert_data_to_timeseries函数,该函数目的是将原始数据中的某地销售数据转换 为Series结构,其索引为年月构成的时间,因为Series强大的功能方便进行统计。 (3)可视化销售数据。 (4)从销售数据的可视化中发现数据的规律。 实验二回归算法实验 实验目的: 1.了解回归算法理论基础 2.编程实现分类算法 实验设备: 计算机 OS:Ubuntu16.04 Python:v3.7 实验主要内容及步骤: 1.实验内容 (1)对波士顿房价的数据集进行回归算法训练。 2.实验步骤 (1)根加载波士顿房价数据集,并且将数据集分割为训练集和测试集。 (2)创建线性回归模型和多项式回归模型并进行训练。 (3)使用模型进行预测并计算其mse。 实验三分类算法实验 实验目的: 1.了解分类算法理论基础 2.编程实现分类算法 实验设备: 计算机 OS:Ubuntu16.04 Python:v3.7 《数据挖掘技术与应用》实验教学大纲-- 《数据挖掘技术与应用》实验教学大纲-- 1.实验内容 人群的收入分类预测。 2.实验步骤 (1)加载数据并查看数据。 (2)转换数据的属性编码。 (3)创建分类器 (4)对新个体采用同样的编码处理,预测其收入类别 实验四机器学习的基本使用流程实验 实验目的: 1.掌握了解机器学习算法理论基础 2.编程实现机器学习 实验设备: 计算机 OS:Ubuntu16.04 Python:v3.7 实验主要内容及步骤: 1.实验内容 实验学习机器学习的开发流程。 2.实验步骤 (1)机器学习框架实验 (2)机器学习的数据加载 (3)数据集的分割 (4)机器学习的训练 (5)判断训练的效果 (6)交叉验证与模型保存 实验五聚类算法实验 实验目的: 1.了解聚类算法理论基础 2.编程实现聚类算法 实验设备: 计算机 OS:Ubuntu16.04 Python:v3.7 实验主要内容及步骤: 1.实验内容 使用聚类算法进行图片压缩。 《数据挖掘技术与应用》实验教学大纲-- 《数据挖掘技术与应用》实验教学大纲-- 2.实验步骤 (1)完成compress_image函数,该函数实现图片压缩功能。 (2)创建plot_image函数打印图片 (3)读入图片,设置压缩率,实现压缩 实验六推荐算法实验 实验目的: 1.了解协同过滤理论基础 2.编程实现协同过滤算法 实验设备: 计算机 OS:Ubuntu16.04 Python:v3.7 实验主要内容及步骤: 1.实验内