预览加载中,请您耐心等待几秒...
1/8
2/8
3/8
4/8
5/8
6/8
7/8
8/8

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

目录TOC\o"1-3"\h\z\u HYPERLINK\l"_Toc340599511"摘要 PAGEREF_Toc340599511\hI HYPERLINK\l"_Toc340599512"关键词 PAGEREF_Toc340599511\hI HYPERLINK\l"_Toc340599513"1 引言 PAGEREF_Toc340599513\h1 HYPERLINK\l"_Toc340599514"2 异常值的判别方法 PAGEREF_Toc340599514\h1 HYPERLINK\l"_Toc340599515"2.1 检验(3S)准则 PAGEREF_Toc340599515\h1 HYPERLINK\l"_Toc340599516"2.2 狄克松(Dixon)准则 PAGEREF_Toc340599516\h2 HYPERLINK\l"_Toc340599517"2.3 格拉布斯(Grubbs)准则 PAGEREF_Toc340599517\h2 HYPERLINK\l"_Toc340599518"2.4 指数分布时异常值检验 PAGEREF_Toc340599518\h3 HYPERLINK\l"_Toc340599519"2.5 莱茵达准则(PanTa) PAGEREF_Toc340599519\h3 HYPERLINK\l"_Toc340599520"2.6 肖维勒准则(Chauvenet) PAGEREF_Toc340599520\h4 HYPERLINK\l"_Toc340599521"3 实验异常数据的处理 PAGEREF_Toc340599521\h4 HYPERLINK\l"_Toc340599522"4 结束语 PAGEREF_Toc340599522\h5 HYPERLINK\l"_Toc340599523"参考文献 PAGEREF_Toc340599523\h6 试验数据异常值的检验及剔除方法 摘要:在实验中不可避免会存在一些异常数据,而异常数据的存在会掩盖研究对象的变化规律和对分析结果产生重要的影响,异常值的检验与正确处理是保证原始数据可靠性、平均值与标准差计算准确性的前提.本文简述判别测量值异常的几种统计学方法,并利用DPS软件检验及剔除实验数据中异常值,此方法简单、直观、快捷,适合实验者用于实验的数据处理和分析. 关键词:异常值检验;异常值剔除;DPS;测量数据 引言 在实验中,由于测量产生误差,从而导致个别数据出现异常,往往导致结果产生较大的误差,即出现数据的异常.而异常数据的出现会掩盖实验数据的变化规律,以致使研究对象变化规律异常,得出错误结论.因此,正确分析并剔除异常值有助于提高实验精度. 判别实验数据中异常值的步骤是先要检验和分析原始数据的记录、操作方法、实验条件等过程,找出异常值出现的原因并予以剔除. 利用计算机剔除异常值的方法许多专家做了详细的文献[1]报告.如王鑫,吴先球,用Origin剔除线形拟合中实验数据的异常值;严昌顺.用计算机快速剔除含粗大误差的“环值”;运用了统计学中各种判别异常值的准则,各种准则的优劣程度将体现在下文. 异常值的判别方法 判别异常值的准则很多,常用的有检验(3S)准则、狄克松(Dixon)准则、格拉布斯(Grubbs)准则等准则.下面将一一简要介绍. 检验(3S)准则 检验准则又称罗曼诺夫斯基准则,它是按分布的实际误差分布范围来判别异常值,对重复测量次数较少的情况比较合理. 基本思想:首先剔除一个可疑值,然后安分布来检验被剔除的值是否为异常值. 设样本数据为,若认为可疑值.计算余下个数据平均值及标准差,即. 然后,按分布来判别被剔除的值是否为异常值. 若,则为异常值,应予剔除,否则为正常值,应予以保留.其中:为显著水平;数据个数;为检验系数,可通过查表得到. 狄克松(Dixon)准则 设有一组测量数据,且为正态分布,则可能为异常值的测量数据必然出现在两端,即或. 狄克松给出了不同样本数量时检验统计量的计算公式(见表1).当显著水平为1%或5%时,狄克松给出了其临界值.如果测量数据的检验统计量,则为异常值,如果测量数据的检验统计量,则为异常值. 表1狄克松检验统计量计算公式为 数据个数统计量为可疑值为可疑值 格拉布斯(Grubbs)准则 设有一组测量数据为正态分布,为了检验数据中是否存在异常值,将其按大小顺序排列,即,可能为异常值的测量数据一定出现在最大或最小的数据中. 若最小值是可疑的,则检验统计量.式中是均值、是标准差,即.