预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共50页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

相关分析与回归分析章节提纲:第一、二节 -相关分析概述 -相关关系测定变量间关系指数函数三、相关关系 相关系数是度量两个变量之间线性相关的方向和强度的测度,常用的度量指标是皮尔逊(Pearson)相关系数 【专栏】在相关分析中,定性分析或经济理论分析重要吗?相关系数(CorrelationCoefficient)1.总体相关系数(Populationcorrelationcoefficient)去掉n,公式如下:度量线性关系的强度和方向: 1)r=0--无线性关系,或很弱 2)若绝对值较大 --线性关系较强 3)符号正负 --线性关系的方向 4)+1or-1--完全相关,实践中少见第三节一元线性回归分析第三节一元线性回归分析一、一元线性回归理论模型 一元线性回归模型是用于分析一个自变量x与一个因变量y之间线性关系的数学方程,在变量x与y的直角坐标平面上,可以绘制散点图,可以看出所有的散点大致呈线性关系根据刚才的那组表。是不是最后会呈这样的图形最小平方法 是测定长期趋势最常用的的方法。它是通过建立数学方程,对元时间序列配合一条较为理想的趋势线,使得原序列中的各实际值和趋势值的离差平方最小。一般最小平方法的统计表达式是:(一)直线方程 即求方程组:横轴表示时间,纵轴表示元数列的指标数值,坐标原点定在1990年,其序号0用来表示,拟合直线趋势方程。上述方程中的x为时间。为了计算方便,可对其进行假设: 当时间项数为奇数时,可假设x的中间项为0,这时时间项依次排列为:…,-3,-2,-1,0,1,2,3,…; 当时间项数为偶数时,可假设原点0在数列正中相另两个时间的中点,这时时间项依次排列为:…,-5,-3,-1,1,3,5,… 这种设x的方法是要使时间项的正负相抵消,使x=0,则上述联立方程组可简化为:例如;用简便的方法来计算上面例子。年份案例:某地区粮食产量直线趋势方程计算(i)已知:n对观察值(X1,Y1),(X2,Y2),…,(Xn,Yn); (ii)作散点图(scatterdiagram) (iii)若散点图呈直线趋势,则配一条直线: 求出直线的方程式 什麽是回归?给定X的数值,Y的数值取在在一个平均值(y|x)附近 对应与不同的X值,Y的平均值座落在一条直线上 ----回归直线. y|x和X的关系可用一个线性方程描写.三、一元回归的统计检验3.估计标准误差接下来的内容只做拓展相关系数计算 检验的步骤 根据公式计算相关系数r值 根据给定的显著性水平α,查相关系数检验表,自由度为n-2,得到临界值 统计决策r随样本变化而变化,是一个随机变量 总体的回归系数 r→ 问题:=0吗? 假定:X和Y服从二元正态分布1、离差平方和的分解P316离差平方和的分解 TSS=RSS+ESS 拟合优度检验(判决系数R2) t检验:是对回归系数的显著性检验 t检验的基本步骤 提出假设 构造t检验统计量,并由样本数据计算t检验值 根据显著性水平α,查t分布表,得到临界值 统计决策 b随样本变化而变化,是一个随机变量 总体的回归系数 b→ 问题:=0吗? 统计量残差的标准差放在分子,散点分布情况,分母是X的离均差平方之和,反映了父亲身高的变异性,父亲如果有高高唉唉,那么(离均差的平方值)变异性就大。 所以b的变异性是和两者有关。b在这里就是斜率,斜率怎么会变,翘起来,或者压下去,样本变了。斜率的变异性跟两个因素有关,散点的分散性,同时和估计身高的分散性(X轴上的分散性)有关。 若父亲的高矮千遍一律,斜率变异性怎么样,翘得就低,相反就高(上下两点拉大)敲高。如果是X轴分散,(左右拉大),换一份样本,变化小一些。P320例子9-9F检验是对回归总体线性关系是否显著的一种假设检验 F检验的基本步骤 提出假设 构造F检验统计量,并由样本数据计算F检验值 根据显著性水平α,查F分布表,得到临界值 统计决策F检验是对整个模型而已的,看是不是自变量系数不全为0,而t检验则是分别针对某个自变量的,看每个自变量是否有显著预测效力。3.回归方程的应用 估计平均值的范围 --平均值的置信区间(CI) (2)估计个体值Y的范围 --个体值的预测区间(PI)第四节-多元回归分析 式中:a——基期水平,b——平均发展速度,x——时间 a、b均为未定参数。求解指数方程时,一般是将指数方程通过取对数转化为直线方程,然后按直线方程办法求出参数,再对所得结果查反对数还原。 案例:某地区工业净产值指数曲线方程计算