预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共24页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

对应分析SPSS操作对应分析(一):简单对应分析数据是一个加权的数据,也就是频数数据。 num:指定为频数变量,在分析中无需再次加权hair和eye为需要分析的变量。选择“分析”—>“降维”—>“对应分析”选择“模型”,如截图所示 解的维数:相当于因子分析和主成分分析中的维数,通常默认为2,看能否进行解释,若不可以,则可以根据累计方差进行选择。 距离度量:选择“卡方”(一般分类变量距离度量选择卡方,而数值变量的距离度量选择欧式距离) 标准化方法:选择“行和列均值已删除” 行和列均值已删除:行和列均中心标准化 行均值删除:对行中心标准化。 列均值删除:对列中心标准化 使行总和相等,删除均值:使行的边际相等,对行中心化。 使列总和相等,删除均值:使列的边际相等,对列中心化。 正态化方法:选择默认值“对称” 对称法:适用于行列变量间有相关关系 主要行(列):适用于行(列)变量间有一定的差别 主要:既考虑行,又考虑到列。 点击“统计量” 选择“对应表”,“行点概览”,“列点概览” 对应表:作出行列对应表 行点概览:行变量的因子分析表 列点概览:列变量的因子分析表 对应表的排列:研究一定维数的对应表(此处的维数应小于对应表中的最大维数) 行轮廓表:行变量的频数分布表 列轮廓表:列变量的频数分布表 置信统计量:显示在95%置信区间下的统计量。选择“绘制” 散点图 双标图(必选):可以在双坐标轴上,同时作出行列变量在坐标系中的距离关系。 行(列)点:行变量的散点图 标识标签宽度:为小于等于20的整数 线图(通常不选) 已转换的行(列)类别:行(列)的因子构成的线图 图维数(选择默认) 显示解中的所有维数 限制维数:最低维数通常设定为1; 最高维数为:总体样本量—1 由表中的卡方值(1240.39)和p值(小于0.05)知行列变量之间存在一定的相关性。 从表格中可以看出,原始交叉表中最多可以提取三个维度,因为第一维度与第二个维度已经可以解释99.6%的信息了,而第三个维度只携带0.4%的信息,所以第三个维度可以忽略,只考察前两个维度的信息。概述行点:把行变量头发颜色的五个类别在两个维度里进行坐标值的计算,同样,概述列点是把列变量眼睛颜色的四个类别在整个空间中进行坐标值的计算。可以根据两个坐标值得到最终的对应分析图。在对应分析图中,分别向x轴和y轴加入参考线,并将位置改在原点0.0处。可以得到原点(0.0)。 原点(0.0)表示没有任何倾向,没有任何关联的一个中心位置。 对应分析图的阅读对图形的分析对图形的分析>避免错误的解释对应分析中应注意的问题案例2(基于均数的对应分析): 本数据来自《2000年中国统计年鉴》,见文件mean.sav。共记录了全国29个省、市、自治区(未包括香港、澳门、台湾地区及海南、青海、西藏数据)当年的城市市政工程建设状况,具体有如下6个指标:road(年末实有道路长度)、area(年末实有道路面积)、bridge(城市桥梁数)、under(城市下水道长度)、water(城市污水处理能力)、lamp(城市路灯数)。现希望考察各省(市)城市设施水平的建设情况差异,特别是各地区在这些指标上分别存在着哪些优势和不足之处。 分析: 这里主要考察各地区在各个指标上有何差异,例如:北京在哪些指标上高于平均水平,哪些指标低于平均水平,而这符合对应分析反映类别间差异的特点,故使用对应分析法。如果分析的目的不同,如综合评价,则应考虑因子分析等方法。 数据格式: 行列变量形成的交叉表,列变量每一个类别以单独变量的形式出现,行变量各类别单独占一行,同时存在数值型变量rowcat_,其取值和变量值选项代表了行变量的不同类别名称,例如:1为广东,2为江苏。对话框中选入road和area,并将它们的取值范围定义为1~2只是为了能够顺利完成程序复制,并没有实际意义。此处的变量都为数值型变量,因而对于距离的度量选用欧式距离 标准化方法的选择:“使列总和相等,删除均值” 分析: 此处6项指标的均数大不相同,同时它们的量纲也相差较大,最大值、最小值的倍数在几十到几千不等;另外,各省(市)发展水平的差异是希望考察的内容。 故使用“使列总和相等删除均值”这一标化方法更为妥当,它可以消除各指标均数和量纲不同的影响,同时又保留了地区发展水平的差异。点击“粘贴”按钮,在程序中将table语句右侧的定义“road(12)byarea(12)”改为“all(296)”,这表明数据是以交叉表形式出现,而且为29行、6列 Rowcat_为控制变量,不计入列中 注意:更改时使用英文符号输入。该摘要表中,前两个维度共携带了总信息量的91.9%,因而使用默认的二维所得到的结果是比较好的。Thankyou