预览加载中,请您耐心等待几秒...
1/5
2/5
3/5
4/5
5/5

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

·18·华南预防医学2012年2月第38卷第1期SouthChinaJPrevMed,February2012,Vol38,No.1·论著·聚类分析在医疗费用数据挖掘中的应用沈培1,2,张吉凯3【摘要】目的建立一种预处理方法,在进行医疗费用数据挖掘时,将因变量(呈偏态分布的连续性变量)转换为分类变量,从而得到更加科学合理的研究结果。方法以广东省甲型病毒性肝炎医疗费用调查取得的115例患者为研究对象,分别采用中位数的分类方法和K-means聚类的方法作为预处理方法,对医疗费用这一呈偏态分布的因变量进行分类,然后建立支持向量机数学模型,采用支持向量机进行医疗费用影响因素分析;通过比较模型的预测精度、模型收益以及影响因素的筛选结果,确定最优的预处理方法。结果115例甲肝病人甲肝总住院费用中位数为2744.69元,呈偏态分布。应变量以中位数方法分类,采用支持向量机模型筛选影响因素结果显示,对医疗费用影响最大的有7个变量(前3位为医院等级、性别、疾病类型);采用聚类分析进行数据预处理时筛选影响因素结果显示,对医疗费用影响最大的有7个变量(前3位为医院等级、住院天数、支付方式)。与中位数方法的分类方法比较,采用聚类分析进行数据预处理时,支持向量机模型结果得到的预测精度由91.30%上升到97.39%;收益图表陡峭地升高到100.00%然后渐渐变得平缓,显示模型收益更好;影响因素筛选结果更加科学合理,符合实际情况。结论聚类分析是一种优秀的数据挖掘预处理方法,具有良好的应用性。【关键词】数据挖掘;聚类分析;卫生保健费用中图分类号:R197.323文献标识码:A文章编号:1671-5039(2012)01-0018-05ApplicationofclusteringanalysisinmedicalexpensesdataminingSHENPei*,ZHANGJi-kai.*SchoolofManagement,HuazhongUniversityofScienceandTechnology,Wuhan430074,China【Abstract】ObjectiveInthemedicalexpenseresearch,establishapretreatmentmethodtotrans-formthecontinuousdependentvariabletocategoricalvariabletogetmorereasonableresult.MethodsDataof115patientswereobtainedfromthesurveyofmedicalcostsforpatientswithviralhepatitisinGuangdongProvince.TheclassificationofthemedianandK-meansclusteringmethodwereusedasapre-treatmentmethodtoclassifytheskeweddistributiondependentvariablesofmedicalexpensesforhepatitis.Then,asupportvectormachinemathematicalmodelwasestablishedtoanalyzetheinfluencefactorsofmed-icalexpensesbysupportvectormachine.Bycomparingtheforecastingaccuracy,modelgain,andselectionofdependentvariables,theoptimalpretreatmentmethodwasdetermined.ResultsThemedianofmedicalexpensesofhospitalizationfor115patientswithviralhepatitiswas2774.69yuan,showingaskeweddistri-bution.Usingsupportvectormachinemodelselectioninfluencefactors,theresultshowedthatsevenvaria-bleshadgreatestimpactonmedicalcosts(Thetopthreewerehospitallevel,gender,anddiseasetype.).Whileusingclusteranalysisasdatapretreatmentmethod,theinfluencefactorsselectionshowedthatsevenvariableshadgreatestimpactonthemedicalexpenditure(The