预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共478页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第1章数据预处理概述章节概述/Summary1.11.21.31.41.4常用的数据预处理库1.5第2章科学计算库—numpy章节概述/Summary2.12.1数组对象2.1数组对象2.22.32.3.3使用切片访问元素2.42.4.1形状相同的数组间运算2.4.1形状相同的数组间运算2.4.2形状不同的数组间运算2.4.2形状不同的数组间运算2.4.2形状不同的数组间运算2.4.3数组与常量的运算2.52.5.2检索数组元素2.62.6数组的转置2.6数组的转置2.6数组的转置第3章pandas库基础章节概述/Summary3.13.23.2.1索引对象3.2.1索引对象3.2.2使用单层索引访问数据3.2.3使用分层索引访问数据3.2.4重新索引3.33.43.5第4章数据获取章节概述/Summary4.14.1从CSV和TXT文件获取数据4.24.2从Excel文件获取数据4.34.3从JSON文件获取数据4.44.54.5从数据库获取数据4.64.6.1python-docx概述4.6.1python-docx概述4.6.1python-docx概述4.74.7.1pdfplumber概述第5章数据清理章节概述/Summary5.15.1数据清理概述5.1数据清理概述5.25.2.2缺失值的处理5.2.2缺失值的处理5.2.2缺失值的处理5.2.2缺失值的处理5.2.2缺失值的处理5.35.3.2重复值的处理5.45.4.1异常值的检测5.4.1异常值的检测5.4.1异常值的检测5.4.1异常值的检测5.4.1异常值的检测5.4.1异常值的检测5.5第6章数据集成、变换与规约章节概述/Summary6.16.1.1数据集成概述6.1.2合并数据6.1.2合并数据6.1.2合并数据6.1.2合并数据6.1.2合并数据6.1.2合并数据6.26.2.1数据变换概述6.2.1数据变换概述6.2.2轴向旋转6.2.4哑变量处理6.2.5面元划分6.2.5面元划分6.36.3.1数据规约概述6.3.1数据规约概述5.2第7章数据清理工具——OpenRefine章节概述/Summary了解数据分析的流程与pyecharts库上述问题是数据分析或数据挖掘时期比较常见的一些数据问题,这些问题值得一提的是,当使用read_excel()函数读取Excel文件时,若出现“伪异常”,即准确的数据;象,该对象中若包含True,说明True对应的一行数据为重复项。使用pdfplumber库读取PDF文件的基本步骤箱组件、视觉映射组件、提示框组件、数据区域缩放组件,其中每个配置项都对应一个类。最邻近插值是用与缺失值相邻的值作为插补的值。入一个已有的OpenRefine3小节)、哑变量处理(6.本章将针对numpy库的基础功能进行详细地讲数据一般是质量不高的“脏”数据,直接使用可能会导致分析基于分层索引的Series类对象axis:表示轴编号(排序的方向),0代表按行排序,1代表按列排序。定义的标签构成的索引)、时间戳索引(由时间戳构成的索7.1OpenRefine介绍7.27.37.3.1基本配置7.3.3操作列7.3.3操作列7.3.3操作列7.3.3操作列7.3.5导出数据7.47.4.1数据排序7.4.2数据归类7.4.2数据归类7.4.3重复检测7.4.4数据填充7.4.5文本过滤7.4.6数据转换7.5第8章实战演练——数据分析师岗位分析章节概述/Summary8.18.1.2使用pyecharts绘制图表8.1.2使用pyecharts绘制图表8.28.2分析目标与思路8.38.3数据收集8.3数据收集8.48.4数据预处理8.58.5.1数据分析师岗位的需求趋势8.5.2数据分析师岗位的热门城市Top108.5.3不同城市数据分析师岗位的薪资水平8.5.4数据分析师岗位的学历要求