预览加载中,请您耐心等待几秒...
1/5
2/5
3/5
4/5
5/5

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

数据挖掘技术在医院信息系统中的应用摘要:医院信息系统HIS实现了联机事务处理功能对系统中数据的应用大多局限于查询统计应用于辅助决策尚未完善。随着HIS应用水平的不断提高和数据挖掘技术的不断进步将数据挖掘技术应用于医院信息系统已成为热门话题。文章以数据挖掘在HIS中的应用为目标介绍了数据挖掘技术的定义、HIS数据的特点、数据挖掘的步骤及任务。关键字:数据挖掘;HIS;特点;任务1引言近年来随着电子信息技术的迅速发展医院信息系统(HIS)、数字医疗设备和医药企事业单位信息系统的广泛应用各医疗卫生单位计算机中的数据容量不断膨胀。数据库技术的发展在不断地解决海量数据的存储和数据检索的效率问题但无法改变“数据爆炸但只是贫乏”的现象如何充分应用这些宝贵的医学数据资源来为疾病的诊断和治疗提供科学的决策促进医学研究已成为人们关注的焦点。数据挖掘(DataMiningDM)是一个近些年才发展起来的信息处理技术它是从大量数据中提取出可信的、新颖的、有效的并最终能被人理解的信息模式处理过程它涉及数据库、人工智能、统计学、模式识别、可视化技术、并行计算等众多领域知识。医学数据挖掘是一门涉及面广.技术难度大的新兴交叉学科它需要从事智能信息处理、计算机、应用数学的科研人员与医务工作者通力合作将数据挖掘技术应用到医学数据库中用以发现其中的医学诊断规则和模式从而辅助医生进行疾病诊断帮助管理者发现并创造新的管理方法和手段。2数据挖掘的定义从商用角度来看数据挖掘可定义为一种类深层次的数据分析方法是按照企业既定业务目标对大量企业数据进行探索和分析揭示隐藏的、未知的或验证已知的规律性为企业决策提供真正有价值的信息并进而获取利润的一种模型化的先进方法。从技术角度来看数据挖掘是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中提取隐含在其中的、人们事先不知道的、但又有潜在有用的信息和知识的过程。由定义可看出数据挖掘与传统数据分析(如查询、报表、联机应用分析等)的本质区别在于数据挖掘是在没有明确假设的前提下挖掘信息、发现知识换言之数据挖掘所得到的信息应当具有预知未知、有效和可实用3个特征。3数据挖掘技术在医院信息系统中的应用数据挖掘技术的产生时间不长但其在商业、产业、电信等领域的应用已相当广泛并取得了客观的经济和社会效益。由于医疗卫生系统本身具有的复杂和时变的特性导致数据挖掘技术在医疗卫生领域的应用尚处于起步阶段。但医学技术作为一门验证性的科学因此在该领域的数据挖掘具有较强的实用价值和广阔的应用前景。3.1医院信息系统的数据特点医院信息系统中包含了医疗过程和医患活动的全部数据资源既有临床医疗信息又有医院管理的相关信息。这些信息反映了医学的独特性。3.1.1多态性医院信息系统中的数据包括纯数据(如体征参数、检验结果等)、影像(如CT、B超等)、信号(如ECG、EEG等)、文字(如患者检查检验结果、病历记录等)等因此其具有模式的多态性这也是其区别于其他领域的显著特征。3.1.2不完整性医院信息系统中的数据是在对患者进行诊疗的过程中收集的是以对患者进行诊断并最终治愈为目的并非以研究为目的再加之人为因素也可导致数据记录的偏差和缺失因此搜集的数据具有疾病信息的客观不完整性和描述疾病的主观不完整性。3.1.3冗余性医院信息系统是一个特殊的系统系统中的某些数据关乎患者的健康安全如发药信息、检查检验结果数据等为进行数据校验保证数据的正确性系统会保存大量重复的、甚至是相互矛盾的数据记录。3.1.4隐私性医院信息系统中保存了患者的所有信息包括身份信息、诊疗信息、费用信息等也不可避免地会涉及到患者的隐私一旦这些隐私信息被暴露并对患者的日常生活造成侵扰就会涉及到较多的伦理、法律等问题。3.2医院信息系统数据挖掘的步骤数据挖掘可分为预处理和挖掘分析两个阶段如图l所示。由于医学数据具有前文所介绍诸多特性需要对带挖掘数据进行筛选、清洗、匿名化、标识转换等操作因此通常需要花费较多时间通常约占总时间的60%。3.3医院信息系统数据挖掘的任务3.3.1分类分类是指根据一个可预测属性将事例分为多个类别是最常见的数据挖掘任务之一。医生根据望闻切诊以及辅助检查对患者进行疾病诊断实际就是一个疾病分类的过程即根据患者的疾病特征将其划分为某个疾病或某类疾病。典型的分类算法有决策树、神经网络和贝叶斯算法。3.3.2聚类聚类也称细分是基于一组特定的属性对事例进行分组的数据挖掘方法。利用聚类分析工