预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共77页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

专题2 概率统计建模基本原理及方法数据的统计描述及分析一、随机变量及其分布 1.二项分布 例1.能量供应问题其次,要根据经验来估计出,p值是多少?例如,一个工人 在一个小时里有12分钟在使用电力,那么应该有可以看出,练习:用MATLAB计算本题 binopdf(x,n,p)计算x中每个值对应的二项分布概率 binocdf(x,n,p)计算x中每个值对应的分布函数值 例如binopdf(0:10,10,0.2)2.Poisson分布 例2.Rutherford对裂变物质的观测我们用X表示ΔT=7.5秒内观测到的α粒子数,它是 一个随机变量,服从什么分布呢?在2608次观测中,共 观测到10094个α粒子数,平均每次观测到 λ=M÷N=10094÷2608≈3.87 个α粒子数,用参数为λ=3.87的Poisson分布P计算一下:可以看出,认为X服从参数为3.87的Poisson分布还是非常 合理的。在后面统计部分,我们会用Pearson-拟合检验法来 证明这种合理性问题:Poisson分布是又一类非常重要的用来 计数的离散型分布,它依赖于一个参数。什么 样的随机变量会服从Poisson分布呢?在给定的观测范围内(例如给定时间内,给定区域内等等), 事件会发生多少次?把观测范围分成n个小范围: 给定事件在每个小范围内可能发生,也可能不发生,发生多少 次取决于小范围的大小; 2.在不同的小范围内发生多少事件相互独立; 3.在小范围里发生的事件数多于一个的概率,和小范围的大小相 比可以忽略不计,用表示在小范围内事件发生一次的概率。3.正态分布大量连续型随机变量服从正态分布,所以正态分布在处理数据时是非常有用处的。我们在统计部分会大量用到它。下面是正态分布的密度函数图像:4.指数分布设是给定常数,则Y的分布函数为b=0的指数分布的密度函数图像如下所示(指数密度):5.多维随机变量(1)边际分布与独立性综上所述,我们知道在概率论里学过许多分布, 当然,还有许多分布我们没有学过。但是,在实践中 我们可能会遇到各种各样的分布,甚至还有没被发现 的分布。在处理数据的时候,我们要搞清楚:二、数据的统计描述与分析 1.经验分布函数和频率直方图 当我们确定讨论的指标的确是随机变量后, 剩下的关键任务就是确定它的分布。那么它的 观测数据就是我们赖以解决问题的基本资料, 叫做样本,而这个随机变量就叫做总体。这些 数据反映了该随机变量分布的基本特征。我们 可以利用这些数据构造一个分布函数,理论上 可以证明它很接近于那个未知分布。这个分布 函数就叫做经验分布函数。在例2,我们确定所讨论的指标—在时间间隔ΔT秒 内放射出的α粒子数X,是一个随机变量。且有该随机 变量的n=2608个观测值,这就是一个容量为2608的样 本。在没有其他信息的情况下,首先应该给出该样本的 经验分布函数:23这个函数的图像如下(Poisson2):当然,由于是离散型的随机变量,我们可能更熟 悉如下频率分布图像:例7、超市问题(频率直方图) 随机抽取某大学超市137位顾客的购买金额的实际记录 (单位:元),数据如下。请问购买金额服从什么分布?用X表示顾客的购买金额,那么它应该是一个连续型的随机 变量。对于连续型的随机变量,我们一般就不作它的经验分布 函数了,而是改作它的频率直方图。一般认为,X应该服从正态 分布,数学期望为它很像参数为经验分布函数、频率分布图和频率直方图可以帮助 我们了解随机变量的类型。当我们已经了解到随机变量 的分布类型后,该随机变量的分布一般就取决于一个或 几个参数了。如果知道了这些参数,就可以把分布完全 确定下来。那么,如何确定这未知参数呢?(参数估计)2.常用统计量及其分布313.几个在统计中常用的概率分布3334返回1.点估计的求法(二)极大似然估计法2.区间估计的求法1、已知DX,求EX的置信区间1.参数检验:如果观测的分布函数类型已知,这时构造出的 统计量依赖于总体的分布函数,这种检验称为参数检验. 参数检验的目的往往是对总体的参数及其有关性质作出明 确的判断.假设检验的一般步骤是:(一)单个正态总体均值检验44(二)单个正态总体方差检验(三)两个正态总体均值检验(四)两个正态总体方差检验例9、续例2(离散型)检验的第一步要解决的问题是,如果H0成立,那么它服从参数 为多少的Poisson分布?要先估计未知参数。因为这时505152(二)概率纸检验法1.数据的录入、保存和调用(1)年份数据以1为增量,用产生向量的方法输入。 命令格式:x=a:h:b t=78:87(1)输入矩阵: data=[78,79,80,81,82,83,84,85,86,87,88; 23.8,27.6,31.6,32.4,33.7,34.9,43.2,52.8,63.8,73.4