预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共90页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第七章典型相关与对应分析7.1典型相关分析 7.1.1典型相关分析的概念与步骤 7.1.2用INSIGHT模块实现典型相关分析 7.1.3用“分析家”实现典型相关分析 7.1.4用CANCORR过程实现典型相关分析7.1.1典型相关分析的概念与步骤 1.典型相关分析的基本思想 典型相关分析采用主成分的思想浓缩信息,根据变量间的相关关系,寻找少数几对综合变量(实际观测变量的线性组合),用它们替代原始观测变量,从而将二组变量的关系集中到少数几对综合变量的关系上,通过对这些综合变量之间相关性的分析,回答两组原始变量间相关性的问题。除了要求所提取的综合变量所含的信息量尽可能大以外,提取时还要求第一对综合变量间的相关性最大,第二对次之,依次类推。这些综合变量被称为典型变量,或典则变量,第1对典型变量间的相关系数则被称为第1典型相关系数。典型相关系数能简单、完整地描述两组变量间关系的指标。当两个变量组均只有一个变量时,典型相关系数即为简单相关系数;当其中的一组只有一个变量时,典型相关系数即为复相关系数。2.典型相关系数与典型相关变量 设X=(X1,X2,…,Xp)',Y=(Y1,Y2,…,Yq)'是两个随机向量。利用主成分思想寻找第i对典型相关变量(Ui,Vi): Ui=ai1X1+ai2X2+…+aipXp=ai'X Vi=bi1Y1+bi2Y2+…+biqYq=bi'Y i=1,2,…,m=min(p,q);称ai'和bi'为(第i对)典型变量系数或典型权重。记第一对典型相关变量间的典型相关系数为: CanR1=Corr(U1,V1)(使U1与V1间最大相关); 第二对典型相关变量间的典型相关系数为: CanR2=Corr(U2,V2)(与U1、V1无关;使U2与V2间最大相关)… 第m对典型相关变量间的典型相关系数为: CanRm=Corr(Um,Vm)(与U1,V1,…,Um–1,Vm–1无关;Um与Vm间最大相关)3.典型相关变量的性质 各对典型相关变量所包括的相关信息互不交叉,且满足: 1)U1,U2,…,Um互不相关,V1,V2,…,Vm互不相关,即其相关系数为2)同一对典型相关变量Ui和Vi之间的相关系数为CanRi,不同对的典型相关变量之间互不相关,即: 3)Ui和Vi的均值为0,方差为1(i=1,…,m)。 4)1≥CanR1≥CanR2≥…≥CanRm≥04.典型相关系数的求解步骤 1)求X,Y变量组的相关阵 R=; 2)求矩阵 A=(R11)–1R12(R22)–1R21 和 B=(R22)–1R21(R11)–1R12, 可以证明A、B有相同的非零特征值; 3)求A或B的特征值λi与CanRi,A或B的特征值即为典型相关系数的平方:λi=(CanRi)2,i=1,…,m。4)求A、B关于λi的特征向量。设ai为A关于λi的特征向量,bi为B关于λi的特征向量,则ai'和bi'为(第i对)典型变量系数。即第i对典型相关变量(Ui,Vi): Ui=ai'X*=ai1X1*+ai2X2*+…+aipXp* Vi=bi'Y*=bi1Y1*+bi2Y2*+…+biqYq* i=1,2,…,m=min(p,q);其中X*,Y*为原变量组的标准化。5.特征根 特征根(eigenvalue)是方差分析和多元检验的基础,特征根与典型相关系数之间的数量关系为: 上式可以理解为第i对典型变量表示观测变量总方差作用的指标,它的值越大说明表示作用越大。6.典型相关系数的标准误 7.典型相关系数的假设检验 典型相关系数的假设检验包括对全部总体典型相关系数的检验和对部分总体典型相关系数的检验。对数据的要求: 1)两个变量组均应服从多维正态分布: (X,Y)~Np+q(μ,σ2) 2)n>p+q(1)全部总体典型相关系数为0 H0:CanRi=0,i=1,…,m H1:至少有一个CanRi≠0 检验的似然比统计量为 对于充分大的n,当H0成立时,统计量 近似服从自由度为pq的2分布。(2)部分总体典型相关系数为0 仅对较小的典型相关作检验: H0:CanRi=0,i=s,…,m,2≤s≤m H1:至少有一个CanRi≠0 其检验的统计量为 对于充分大的n,当H0成立时,统计量 近似服从自由度为(p–k)(q–k)的2分布。7.1.2用INSIGHT模块实现典型相关分析 1.实例 【例7-1】1985年中国28省市城市男生(19~22岁)的调查数据,见表7-1。其中6项形态指标:身高(cm)、坐高、体重(kg)、胸围、肩宽、盆骨宽,分别记为x1,x2,…,x6;5项机能指标:脉搏(次/分)、收缩压(mmHg)、舒张压(变音)、舒张压(消音)、肺活量(ml),分别记为y1,y2,…,y5。表7-1城市男生(19~22