预览加载中,请您耐心等待几秒...
1/4
2/4
3/4
4/4

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

万方数据 舻孚统计数据异常值的识别及R语言实现电子技术statistical蛐outliers电子技术研发EIeclrOnicspro伊锄packageso觚are;GmbbsR&D舟算>豫则第价数据为异常值,否则为正常值。(菏泽学院经济系)摘要:从统计理论的角度探讨识别统计数据中的异常值,即Grubbs法、dixon法在识别统计数据中的异常值中具有的重要的作用:介绍了在R语言的环境下,程序包ouniers的程序语言,并结合具体实例,说明程序包0utliers在识别统计数据中异常值的作用。关键词:R软件;Gmbbs法;Dixon法;异常值DataLanguageRealization近年来,随着人们对统计数据关注度的不断提高,对统计数据的质量要求也越来越高,而要很好地保证统计数据质量,其中之一就要关注统计数据中的异常值。所谓异常值,是指一批数据中有部分数据与整体中其他数据相比存在明显不一致,也称于记录错误引起的,也可能是由于该数据值不属于这个数据集。异常值是影响统计数据质量的一个非常重要的因素,一直以来,我国的统计界以及社会各界均对此问题给予很高的关注。所以,近年来有关异常值的理论探讨一直是个热点。但是目前研究的重点一直放在统计法律制度的健全以及统计工作程序的完善等方面。虽然这两点确实能提高统计数据的质量,但对于已经形成的统计数据,在进行统计分析之前,我们更关注的是统计数据的误差问题,即所提供的统计数据与客观的社会经济现象实际的数量特征之间的差距问题。异常值的存在,使得统计分析的误差大大增大,小则出现差错,大则可能发生事故,甚至可能会导致严重的宏观决策失误。因此,在利用己得数据进行统计分析之前,必须对异常值进行探测和检验。在统计软件方面,常用的统计软件有SPSS、SAS、S仉啦、R、S.PLUS等。R软件是一个自由、免费、开源的软件,是一个具有强大统计分析功能和优秀统计制图功能的统计软件,现已是国内外众多统计学者喜爱的数据分析工具。本文文章在基于R语言的基础上,结合具体实例,说明R软件程序包outliers在识别统计数据中异常值的作用Grubbs法及基于R语言的Grubbs法检验程序举例Grubbs法原理(1)将测量的数据按大小顺序排列。(2)设第f个数据可疑,计算1.2基于R语言的Gmbbs法检验程序在R软件中,用outliers包中的Gmbbs检验可以检验出数据集中的1个或2个异常值,具体命令如下:Grubbs.test【x,type=1其中x是检测数据向量;type=lO表示检测一个异常值,type=1l表示检测2个分别处于两个端点的异常值,type=20表示检测2个一侧的异常值;伽o.sided表示双边检验。1.3应用举例倒l:在一次调查中,收集数据如下:请用Gmbbs法判断是否有异常值?如果有,是R程序如下:>local({pkg<一select.1ist(sort(.packages王怀亮RecognitionofSta廿sticaIOutIiersandRWang(D印anmentUnivefsi曰)import柚tprog删肌langIlageO弓l言为异常数据,或称离群值。异常值的出现可能是由(3)查表哪个?>utils:::menuhlstallPkgs()Huailian2Economics,HezeAbstract:Fromtheviev叩ointstatisticaImeory,theda协out“ersisexplored,whichmeans廿leroleGnlbbsmethodDixoninrccognitionstatisticaldataoutliers.Thealsoin廿0ducesthcprogrampackageoutlierSuIldcrenVironment,andexplainsⅡler0】eoutliersrecognitioncombinedwithspeci靠cexamples.method;Dixonmetllod;outIier10,opposite=FALSE,two.sided;FALSE)8-3、5.5、14.O、7.5、4.7、9.O、6.5、102、7.7、62paperlanguagetlleKeVwords:R1.16’ 万方数据 电子技术(alLavaiJable'TRUE)),鲫hics=TRUE)avail曲le-TRUE)),鲫hics=TRUE)onl一RUE)})电子技术研发EleclronicsR&Dr(pg))ly(pchamcter.only:T默JE)))>x<一c(8.3,5.5,14.O,7.5,4.7,9.O,6.5,lO.2,7.7,6.2)>gnIbbs.tes《x)R分析输出结果:R分析输出结果分析:因为口=0.03