预览加载中,请您耐心等待几秒...
1/3
2/3
3/3

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

大数据环境下动车组故障数据挖掘分析技术分析李恒摘要:动车组故障检修过程中积累大量数据资源若能将其充分开发可辅助动车组故障预警、维修工作的高效开展。为此本文分析大数据环境下动车组故障数据挖掘分析技术通过数据分析挖掘从中总结故障发生规律及原因制定故障风险防控方案实现故障的事前管理。关键词:大数据;动车组故障;数据挖掘引言:国内现役动车组车型较多加之不同运行环境、运行压力的影响使动车组故障类型及引发原因趋于复杂化给故障预防和检修维护工作带来不小难度。大数据背景下利用数据挖掘分析技术完成动车组故障信息的采集、筛选、分类和挖掘即可为故障原因确定及预防维修方案制定提供可靠的理论依据帮助提高故障预防及检修水平因此有必要对故障数据挖掘分析技术进行分析。一、数据挖掘分析技术(一)数据挖掘的内容数据挖掘主要完成关联分析、聚类分析、数据分类、规律预测、损失模型、偏差分析等任务。其中关联分析对两个及以上变量间存在的相互影响管理进行分析常用分析方法包括简单关联、因果关联以及时序关联影响关联分析结果的主要参数为置信度和支持度。聚类分析将带有相同或类似特征的数据聚集到一起命名为同一类别以此来突出不同类别间的差异程度聚类分析在图像处理、客户分析、模式识别等领域有广泛应用。(二)数据挖掘的步骤第一数据清洗。数据清洗可剔除动车组故障数据中的噪声数据、冗余数据或无用数据。由于数据来源较广因此存在一定异常数据不可避免但这部分数据会对数据挖掘分析结果产生一定干扰因此在挖掘分析之前需将其剔除[1]。第二数据集成。数据集成将不同数据源的数据相互组合当描述相同概念的属性处于不同数据库中时其有不同的命名方式若进行数据集成易引发数据冗余或不一致的现象。数据体系中的冗余数据过多会给挖掘分析速度带来负面影响因此需将冗余数据重点清除。第三数据转换。数据转换将原始数据转变为可被挖掘的形式后进行存储主要操作步骤为数据格式化即将原本连续的数据转化为离散型数据易于符号归纳;或将离散型数据转化为连续型方便神经网络计算。第四数据挖掘。该步骤为数据挖掘分析的核心从数据集或数据体系中挖掘潜在的规律或模式用以指导实际工作。数据挖掘开展于数据预处理之后可根据挖掘任务特点选择相适应的数据处理技术。常见的数据挖掘任务有数据特征分析、数据分类、关联性分析等。第五评估与表现。评估与表现对数据挖掘结果进行评价和筛选找出最具价值的规律或模模式经可视化处理后将最终的结果以知识形式呈现给用户。二、數据环境下动车组故障数据挖掘分析技术(一)故障数据模型设计动车组故障数据模型可大致划分为四个层级:(1)状态信息层。该层级包括故障发生时的动车状态信息如故障时间、车次、型号、运行区间、运行距离、运行环境等。(2)故障现象层。该层用以描述故障本身的状态如故障位置、故障形式、发生程度、影响范围、具体描述等。(3)解决方案层。解决方案层可被视为专家库用以存储动车组常见故障类型、故障诱发原因、常用处理方案等结合解决方案层的数据可对动车组实际故障做定性分析并结合历史数据找到最佳的故障排除方案。(4)故障处理层。该层包括故障处理时间、操作人员、具体措施、处理结果等信息。(二)故障数据库搭建动车组故障数据挖掘分析基于大量准确、有效的故障数据为方便数据采集和存储确保故障数据的规范性需搭建相应的故障数据库并完成网络配置。数据库系统软件设计可由计算机技术、网络技术、数据库技术完成。考虑到铁路系统现有资源配置情况及数据库搭建效率以OA网作为数据库运行网络平台动车组故障数据库系统架构包括OA网络、数据库服务器、Web服务器、挖掘分析终端、用户端等模块。故障数据库在VisualStudio2008环境下开发使用B/S架构并以C#为编程语言硬件服务器和软件服务器分别为DELL_R720PC和WindowsServer2008R2Standard。(三)数据库功能实现动车组故障数据库包含如下功能模块:(1)数据录入:完成动车组故障表单的填写、上传及故障数据的批量化导入;表单中部分信息为选择式填入以确保录入数据、名称的规范性;从动车组上下载的故障数据在批量化导入之前需对其进行筛选清除操作提示、状态提醒等与动车故障无关的数据。(2)信息查询:提供多条件组合查询方式。(3)故障统计:包括时间、里程和车型三种统计标准。(4)故障跟踪:跟踪对象为待处理故障和运行观察故障。(5)故障分析:分为车载故障、远程故障数据分析和部件平均寿命计算[