预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共19页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

应用多元统计分析应用多元统计分析 华中科技大学华中科技大学数学系数学系 叶鹰叶鹰 1.概述 1.11.1学科定位学科定位 数理统计的一个分支(统计分布、统计推断) 研究多指标总体(应用矩阵工具) 1928年Wishart分布的发表标志着独立分支诞生 应用广泛(农林、医学、地质、管理……) 计算量大(应用统计软件:SAS,SPSS,S-plus…) 1.概述 1.21.2基本内容基本内容 理论方面:理论方面: ™研究多元总体的分布 如:随机矩阵特征值(向量)的(渐近)分布 ™对分布的性态进行估计和检验 如:检验均值的齐性、协方差的球性、独立性等 应用方面:应用方面: 多元回归分析判别分析 主成分分析因子分析 典型相关分析聚类分析 1.概述 1.31.3应用性研究目标应用性研究目标 1.3.11.3.1简化、压缩数据简化、压缩数据 [医学]对癌症患者进行放射疗法的反应 x症状次数x睡眠时间x食欲 135疗效? x2活动量x4食物摄取x6皮肤反应 [经济学]物价指数、消费指数、经济景气度…… [社会学]评价、评选优秀人物 [农林学]豆类植物品种的改良 x1产量;x2耐旱性;x3蛋白质含量…选种指标y 1.概述 1.31.3应用性研究目标应用性研究目标 1.3.21.3.2假设检验假设检验 [环境学]大城市的空气污染程度,在一周内 大致保持不变工作日与周末有明显不同 [社会学]通过25变量的583组数据研究美国职业结构 •需求requirement 经济指标决定论3R决定论•日常routines •报酬rewords 1.概述 1.31.3应用性研究目标应用性研究目标 1.3.31.3.3分类和分组分类和分组 [生理学]由多个生理指标产生科学的鉴别方法 酗酒者非酗酒者 [金融学]利用会计财务数据为银行建立判别方法 有尝付能力有财政危机 1.概述 1.31.3应用性研究目标应用性研究目标 1.3.41.3.4变量的依赖性变量的依赖性 [运动学]十项全能的成绩依赖的基本体能因子: 短跑速度;臂力;长跑耐力;腿力 [心理学]企业经理的冒险倾向与个人业绩之间的关系 1.概述 1.31.3应用性研究目标应用性研究目标 1.3.51.3.5预测预测 [地质学]由人工地震波分析地质构造,含矿量。 [教育学]由中学成绩预测大学成绩。 1.概述 1.41.4参考书参考书 [1]Anderson.T.W(1958,1984) 《《IntroductionIntroductiontotoMultivariateMultivariateStatisticalStatisticalAnalysisAnalysis》》 [2]Richard.A.J&Dean.W.W(?,?,1998,?) 《《AppliedAppliedMultivariateMultivariateStatisticalStatisticalAnalysisAnalysis》》 [3]张尧庭方开泰,科学出版社(1982,1997) 《《多元统计分析引论多元统计分析引论》》 [4]朱道元吴诚鸥秦伟良,东南大学出版社(1999) 《《多元统计分析与软件多元统计分析与软件SASSAS》》 1.概述 1.概述 1.51.5数据的预处理数据的预处理 1.5.3数据的可视化 例2 1.51.5数据的预处理数据的预处理 1.5.3数据的可视化 例3 1.51.5数据的预处理数据的预处理 1.5.3数据的可视化 例4纸张强度数据(41×3)的散点图和盒状图(马赛克图)。 λ0 λ0.25 λ0.5 λ0.75 λ1 其中λα:P(X>λα)=α λ0=min{xn*,λ0.25+δ0} δ0=1.5(λ0.25−λ0.5) λ1=max{x1*,λ0.75−δ1} δ1=1.5(λ0.5−λ0.75) 1.51.5数据的预处理数据的预处理 1.5.3数据的可视化 例5星形图 1.51.5数据的预处理数据的预处理 1.5.3数据的可视化 例6脸谱图 习题一习题一 1.1.下表为一种进口轿车二手交易数据: 车龄x1355777891011 (年) 销价x22.301.901.000.700.301.001.050.450.700.30 (万元) (1)作数据的散布图和边缘点图。 (2)根据散布图推断样本协方差的正负号。 (3)计算样本均值向量x、样本协方差矩阵S和样本相关 矩阵R。解释这些参数。 习题一习题一 1.2.求下面三维样本资料阵的样本均值向量x、样本协方 差矩阵S和样本相关矩阵R。 9⎛265⎞8 ⎜⎟ 12X=⎜864⎟10 ⎜⎟ 3⎝402⎠1 习题一习题一 1.3.