预览加载中,请您耐心等待几秒...
1/4
2/4
3/4
4/4

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

第23卷第10期计算机应用与软件VoI.23,No.10 2006年10月ComputerAppIicationsandSoftwareOct.2006 模糊聚类分析在乳腺癌图像分类中的应用 1,231 王曙燕周明全耿国华 (1西北大学计算机科学系陕西西安710069) (2西安邮电学院计算机系陕西西安710061) (3北京师范大学信息科学与技术学院北京100875) 摘要研究模糊聚类分析在医学图像数据挖掘中的应用。利用决策树算法对乳腺癌图像数据进行分类,实现了一个基于决策 树算法的医学图像分类器,获得了分类的实验结果。该模型系统达到了较高的分类准确率,证明数据挖掘在辅助医疗诊断中有着广 泛的应用前景。 关键词数据挖掘模糊聚类决策树分类医学图像 APPLICATIONOFFUZZYCLUSTERANALYSIS FORTEMAMMOGRAPYCLASSIFICATION WangShuyan1,2ZhouMingguan3GengGuohua1 (1DepartmentofComputer,NorthwestUni1ersity,XifanShaanxi710069,China) (2DepartmentofComputer,XifanInstituteofPost&Telecoms,XifanShaanxi710061,China) (3CollegeofInformationScienceandTechnology,BeijingNormalUni1ersity,Beijing100875,China) AbstractTostudytheappIicationoffuzzycIusteranaIysisformedicaIimagedatamining.DecisiontreeaIgorithmsareappIiedtothedata miningofthemammographycIassification,proposesamedicaIimagescIassifierbasedondecisiontreeaIgorithm,theexperimentresuItsare given.TheexperimentaIresuItsshowthatthesystemperformsweIIinaccuracy,verifyingthegreatpotentiaIofdataminginginassistantmedi- caItreatment. KeywordsDataminingFuzzycIusterDecisiontreeCIassificationMedicaIimages 好的健壮性且能够学习析取表达式。本文用决策树算法将数字 引言化的乳腺X线照片分为两类:正常和异常。其中异常又分为良 性和恶性两种,良性肿瘤不含癌细胞,而恶性肿瘤有癌细胞 数据挖掘就是从大量的、不完全的、有噪声的数据中,提取组织。 新颖的、有效的和潜在有用的信息的过程。数据挖掘的所处理 的数据类型很丰富,数据挖掘的应用领域也非常广泛。但针对2图像分类 特定领域(如医学)的复杂数据类型的数据挖掘新方法还有待 研究。MDM/KDD2002年会[1]表明多媒体数据挖掘的思想已经2.分类 开始向医学图像、台风预报预测等领域扩展,加拿大、美国和日分类是这样的过程,它找出描述并区分数据类或概念的模 本等国家的科学家已在这方面进行了研究,国内在这方面的研型(或函数),以便能够使用模型预测类标记未知的对象类。导 究还处于起步阶段。出模型是基于对训练数据集(即其类标记已知的数据对象)的 医学图像的数据挖掘旨在从海量的图像数据中挖掘出有效分析。导出模型可以用多种形式表示,如分类规则、决策树、数 的模型、关联、规则、变化、不规则以及普遍的规律,以加速医生学公式或神经网络。 决策诊断的过程和提高其决策诊断的准确度。随着医疗数字化分类是一类重要的数据挖掘问题,可描述如下:输入数据, 设备的快速发展,医学信息数据库中不仅包括病人的结构化的或称训练集,是一条条的数据库记录组成的。每一条记录包含 信息,还包括病人大量非结构化的医学图像信息,为医学图像的若干个属性,组成一个特征向量。训练集的每条记录还有一个 数据挖掘提供了丰富的数据源。特定的类标签与之对应。该类标签是系统的输入,通常是以往 目前妇女乳腺癌发病率越来越高,还没有有效的方法治疗的一些经验数据。一个具体样本的形式可为样本向量:(,, 1112 乳腺癌,因此早期检测就成为治疗和提高存活率的重要因素。⋯,;)。在这里表示字段值,表示类别。 1nc1ic 乳腺X线照片被认为是乳腺癌早期检测的最可靠的方法。在 数据挖掘的各种方法中,决策树归纳学习是应用最广的归纳推收稿日期:2005-10-08。王曙燕,副