预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第八章统计回归模型 回归分析是研究一个变量与其它若干变量之间相关关系的一种数学工具.它是在一组试验或观测数据的基础上,寻找被随机性掩盖了的变量之间的依存关系.粗略的讲,可以理解为用一种确定的函数关系去近似代替比较复杂的相关关系.这个函数称为回归函数. 回归分析所研究的主要问题是如何利用变量、的观察值(样本),对回归函数进行统计推断,包括对它进行估计及检验与它有关的假设等. 回归分析包含的内容广泛.此处将讨论多项式回归、多元线性回归、非线性回归以及逐步回归. 一、多项式回归 (1)一元多项式回归 一元多项式回归模型的一般形式为. 如果从数据的散点图上发现与呈现较明显的二次(或高次)函数关系,则可以选用一元多项式回归. 1.用函数polyfit估计模型参数,其具体调用格式如下: p=polyfit(x,y,m)p返回多项式系数的估计值;m设定多项式的最高次数;x,y为对应数据点值. [p,S]=polyfit(x,y,m)S是一个矩阵,用来估计预测误差. 2.输出预估值与残差的计算用函数polyval实现,其具体调用格式如下: Y=polyval(p,X)求polyfit所得的回归多项式在X处的预测值Y. [Y,DELTA]=polyval(p,X,S)p,S为polyfit的输出,DELTA为误差估计.在线性回归模型中,Y±DELTA以50%的概率包含函数在X处的真值. 3.模型预测的置信区间用polyconf实现,其具体调用格式如下: [Y,DELTA]=polyconf(p,X,S,alpha)求polyfit所得的回归多项式在X处的预测值Y及预测值的显著性为1-alpha的置信区间Y±DELTA,alpha缺省时为0.05. 4.交互式画图工具polytool,其具体调用格式如下: polytool(x,y,m); polytool(x,y,m,alpha); 用m次多项式拟合x,y的值,默认值为1,alpha为显著性水平,默认值为0.05. 例1观测物体降落的距离s与时间t的关系,得到数据如下表,求s. t(s)1/302/303/304/305/306/307/30s(cm)11.8615.6720.6026.6933.7141.9351.13t(s)8/309/3010/3011/3012/3013/3014/30s(cm)61.4972.9085.4499.08113.77129.54146.48解根据数据的散点图,应拟合为一条二次曲线.选用二次模型,具体代码如下: %%%输入数据 t=1/30:1/30:14/30; s=[11.8615.6720.6026.6933.7141.9351.1361.4972.9085.4499.08113.77129.54146.48]; %%%多项式系数拟合 [p,S]=polyfit(t,s,2); 则得回归模型为: . %%%y的拟合值及预测值y的置信半径delta [y,dalta]=polyconf(p,t,S); 得结果如下: y= Columns1through11 11.872915.700220.614826.616833.706041.882651.146561.497872.936385.462299.0754 Columns12through14 113.7759129.5637146.4389 dalta= Columns1through11 0.09370.08650.08290.08160.08170.08230.08270.08270.08230.08170.0816 Columns12through14 0.08290.08650.0937 %%%交互式画图 polytool(t,s,2); polytool所得的交互式图形如图8-1所示. 图8-1 (2)多元二项式回归 多元二项式回归模型的一般形式为. 多元二项式回归命令:rstool(x,y,’model’,alpha)x表示nm矩阵;y表示n维列向量;alpha为显著性水平(缺省时为0.05);model表示由下列4个模型中选择1个(用字符串输入,缺省时为线性模型): linear(线性):; purequadratic(纯二次):; interaction(交叉):; quadratic(完全二次):. 例2设某商品的需求量与消费者的平均收入、商品价格的统计数据如下,建立回归模型,预测平均收入为1000、价格为6时的商品需求量. 需求量10075807050659010011060收入10006001200500300400130011001300300价格5766875439解选择纯二次模型,即. %%%输入数据 x1=[1000600120050030