预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于数据挖掘的设备状态监测和故障诊断_伍星基于数据挖掘的设备状态监测和故障诊断_伍星基于数据挖掘的设备状态监测和故障诊断_伍星基于数据挖掘的设备状态监测和故障诊断伍星陈进李如强陈一鸣(上海交通大学振动、冲击、噪声国家重点实验室,上海200030)会议召开,2002年7月,在加拿大Alberta的Edmonton举办了第8届KDD国际会议。1。2数据挖掘的过程模型数据挖掘是一个涉及大量不同技术和知识的创造性过程。在实施数据挖掘之前,需先确定采取的步骤和将达到的目标,有了好的计划才能保证数据挖掘有条不紊地实施并取得成功。从1992年FrawleyJ和Piatetsky等人第一次提出数据挖掘系统原型后[9],1996年Brachman等人进一步提出了以用户为中心的处理过程模型[10-11].到目前为止,已有很多人对数据挖掘的过程模型进行过归纳和总结,其中最具权威的应该是Fayyadetal(1995)[12],Fayyad、Piatetsky&Smyth(1996)[13]以及Simoudis(1996)[14]给出的描述。另外需要指出的是,现在很多文章中提到1997年3月斯坦福大学的GeorgeH。John在其博士论文中给出另一种过程模型[15],其在内容上与前面提到三种处理模型并没有本质的区别.与此同时,由于商业利益的驱动,很多软件供应商和数据挖掘顾问公司也相应地提出了一些数据挖掘过程模型,来指导他们的用户一步步地进行数据挖掘工作.其中最著名的是跨行业数据挖掘标准过程(CRISP_DM:CRossIndustryStandardProcessforDataMin-ing),此模型在Daimler_BenzAG和OHRA的项目中得到了实践和验证[16]。此外,还有SPSS的5A模型,SAS的SEMMA模型,PMML模型,MicrosoftOLEDB模型,以及专业的数据挖掘技术咨询公司TwoCrows提出的模型等等。在将数据挖掘技术引入到工业设备状态监测和故障诊断之前,应首先从故障诊断的角度对数据挖掘过程模型的四个主要阶段进行理解和描述,这样才能避免应用的盲目性.1)目标理解和定义:数据挖掘最适合于数据正在微弱水平上发生变化而普通人类专家却不能发现的应用。例如在设备状态监测和故障诊断领域,设备操作者可能对设备系统总体特性有很好的了解,但是设备零件的更新和加工对象的变化所引起的监测数据变化的实际知识却很难获得.2)建立挖掘数据集:此阶段一般划分成四个部分,数据选择、数据清理、数据变换和数据归约。由于监测系统得到的数据通常具有多样性、复杂性和海量性的特点,因此必须根据挖掘的目标,在监测数据库和历史数据库中选择相应的数据集,进行清理(如,填充空缺值或忽略等)、变换(如,平滑、聚集、概化等)和归约(如,离散化等)。为了提高挖掘结果的质量,这个步骤大概要花去整个数据挖掘项目80%以上的时间和精力[17]。3)数据挖掘(模型的发现):它是一个反复的过程,可以使用诸如规则学习、决策树、聚类等多种多样的统计和机器学习技术.为了保证挖掘到的模型具有较好的精确度和健壮性,应将挖掘数据集至少分成两个部分:一个用于挖掘模型,另一个用于评价模型。4)模型的应用:由于现实应用数据的不同,在海量数据的驱动下,模型会不断地在学习过程中更新,发现新的设备行为状态和故障模型,从而保证较高的诊断准确率。1.3数据挖掘工具的发展纵观数据挖掘系统产品由20世纪80年代的萌芽到今天的繁荣,可以把它总结为如下三个阶段:第一代数据挖掘系统出现在80年代,包含单一任务的研究驱动工具,包括:决策树工具(如C4。5)或神经网络(如SNNS)建立的分类器等.在1995年左右,数据挖掘公司开发了第二代数据挖掘系统。这些工具主要是实现了知识发现过程要求的多种类型的数据分析和数据清洗和预处理。例如,SPSS的Clementine,SiliconGraphics的Mineset,IBM的IntelligentMiner和SASInstitute的EnterpriseMiner。商业用户的需求导致了90年代晚期出现了基于应用和解决方案的第三代数据挖掘系统,它们面向商业用户,直接解决特定的商业问题,隐藏了所有数据挖掘的复杂性。例如,HNCSoftware的Falcon,IBM的AdvancedScout,NASDRegulation的Advanced_Detection系统,MIT的DataEngine.到1998年,根据HerbEdelstein的调查[18—19],数据挖掘工具市场是45million,比1997年有100%的提高。2工程应用目前,在很多领域,数据挖掘都是一个很时髦的词,尤其是在如银行、电信、保险、交通、零售(如超级市场)等商业领域.而在工业设备状态监测与故障诊断领域的应用主要体