预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共52页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

数学建模之人群中各个体收入有区别吗?全球吃死的人比饿死的人多? 统计方法 利用从一定总体中随机抽取一部分即样本的性质,来推断和预测总体的性质的方法。一.数理统计中的一些基本概念参数估计方差分析(AnalysisofVariance,简称ANOVA),又称 “变异数分析”或“F检验”,是R.A.Fisher发明的,用于 两个及两个以上样本均数差别的显著性检验。由于各 种因素的影响,研究所得的数据呈现波动状。造成波 动的原因可分成两类,一是不可控的随机因素,另一 是研究中施加的对结果形成影响的可控因素。因素A的水平观测值在单因素试验中,假设有r个编号为i=1至r的正态总体,它们分别服从N(i,σ2)分布,当i及σ2未知时,要根据取自这r个正态总体的r个相互独立且方差相同的样本检验原假设H0:各μi(i=1至r)相等,所作的检 验以及对未知参数的估计称为方差分析。总离均差平方和的分解结论1)SST=SSE+SSA《切胚乳试验》用小麦种子进行切胚乳试验,设计分3种处理,同期播种在条件较为一致的花盆内,出苗后每盆选留2株,成熟后测量每株粒重(单位:g),得到数据如下:方差来源 A 误差 总和变量间的相互关系●从涉及的变量数量看 简单相关多重相关(复相关)●从变量相关的程度看 完全相关(B) 不完全相关(A) 不相关(C)回归的古典意义: 高尔顿遗传学的回归概念 一个因变量对若干解释变量依存关系的研究 回归的目的(实质):由固定的自变量去估计因变量的平均值●共同的研究对象:都是对变量间相关关系的分析一般形式根据样本及其观测值可以得到α、β及σ2的估计量及估计值确定未知参数的方法:最小二乘法。根据最小二乘法的要求,由一元回归方程的显著性检验当H0为真时,利用回归方程进行预测多元线性回归模型的一般形式多元回归分析数据格式多元线性回归分析的一般步骤拟合优度公式相关系数:描述两个变量间的线性相关程度。相关性检验:给定显著性水平,查自由度为n-2的临界值; ◆若,表明相关系数r在统计上是显著的, 应否定而接受的假设; ◆反之,若,应接受的假设。三.回归分析为了考评教师的教学质量,教学研究部门设计了一个 教学评估表,对学生进行一次问卷调查,要求学生对 12位教师的15门课程(其中3名教师有两门课程)按以 下7项内容打分,分值为1—5分(5分最好,1分最差)教师编号教师编号定每项都对教师总体评价Y有显著影响,并且各项内 之间也可能存在很强的相关性,他们希望得到一个总 体评价与各项具体内容之间的模型,模型应尽量简单 和有效,并且由此能给教师一些合理的建议,以提高 评价总体评价.逐步回归逐步回归的基本思路是:先确定一个包含若干自变量的初始集合,然后每次从集合外的变量中引入一个对因变量影响最大的,再对集合中的变量进行检验,从变得不显著的变量中移出一个影响最小的,依次进行,直到不能引入和移出为止。引入和移出都以给定的显著性水平为标准。利用MATLAB系统工具箱中的逐步回归命令stepwise可以实现逐步回归。Stepwise提供人机交互式画面,可以在画面上自由引入和移出变量,进行统计分析。具体用法参见MATLAB丛书.利用MATLAB命令得到各个变量的回归系数,置信区间 及剩余标准差(RMSE),决定系数(R-square), 值、值,见表.参数参数回归终得到的模型为在最终模型里回归变量只有1.0000如果初步看来影响因变量的因素较多,并得到了大 量的数据。为了建立一个有效的、便于应用的模型, 可以利用逐步回归只选择那些影响显著的变量“入 围”。如果怀疑原有变量的平方项、交叉项等也会 对变量有显著影响也可以将这些项作为新的自变量 加入到候选行列,用逐步回归来处理。回归分析模型的相关应用06BHIV病毒问题 08B大学学费问题练习题