预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共71页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

数据分析(方法与案例)图并没有说谎,是说谎者在画图。 ——BenjaminDisraeli第2章用图表展示数据学习目标用哪些图形展示奖牌?统计应用把数据画图之后,要用用脑袋2.1用图表展示定性数据 2.1.1生成频数分布表 2.1.2定性数据的图示2.1.1生成频数分布表生成频数分布表(定性数据)定性数据的描述统计量生成频数分布表(定性数据)数据透视表(pivottable)2.1.2定性数据的图示环形图(doughnutchart)环形图(doughnutchart)2.2用图表展示定量数据 2.2.1生成频数分布表 2.2.2定量数据的图示2.2.1生成频数分布表生成频数分布表(例题分析)生成频数分布表(例题分析)分组中的几个概念2.2.2定量数据的图示分组数据看分布—直方图(histogram)分组数据看分布—直方图(直方图与条形图的区别)未分组数据看分布—茎叶图(stem-and-leafplot)未分组数据看分布—箱线图(boxplot)未分组数据看分布—多批数据箱线图(例题分析)垂线图可用于展示多个变量或多个样本取值的分布状况 将属于同一样本或类别的多个取值的散点用一条垂线连接起来,用垂线的长度及垂线上的各个点来反映某个样本或类别取值的差异及其变动状况误差图是以均值为中心,加减一定倍数的标准差(也可以是加减一定倍数的标准误差)绘制而成的(该图也可以绘制均值的一定置信水平的置信区间) 用于展示多个样本或分类的不同取值的分布状况和离散状况两个变量间的关系—二维散点图(2DScatterplots)如果想比较几个变量之间的关系,也可以把它们的散点图绘制在同一张图里,绘制成重叠散点图(OverlayScatter)(注意:绘制重叠散点图时,变量值之间的数值差异不能过大,否则不便于比较) 比如,如果想比较固定资产投资额与地区生产总值和最终消费支出的关系,可以把固定资产投资作为共同的一个坐标轴,地区生产总值和最终消费支出作为另一个坐标轴 也可以绘制散点图矩阵(MatrixScatter)比较多个样本的相似性—雷达图(radarchart)多变量数据—雷达图(例题分析)20世纪90年代初由Inselberg和Dimsdale提出的展示多元数据的图示方法 将各变量用一系列平行的横坐标轴表示,变量值对应纵轴上的位置 可用于研究多个样本在多个变量上的相似程度或变量间的相互关系2.3合理使用图表 一张好的图表应包括以下基本特征 显示数据 让读者把注意力集中在图表的内容上,而不是制作图表的程序上 避免歪曲 强调数据之间的比较 服务于一个明确的目的 有对图表的统计描述和文字说明 5种鉴别图表优劣的准则:一张好的图表应当 精心设计、有助于洞察问题的实质 使复杂的观点得到简明、确切、高效的阐述 能在最短的时间内以最少的笔墨给读者提供最大量的信息 是多维的 表述数据的真实情况本章图解本章小结结束