预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于costsensitive的数据挖掘算法研究的任务书 任务标题:基于cost-sensitive的数据挖掘算法研究 任务描述:此研究任务将会探讨基于cost-sensitive的数据挖掘算法的研究及应用。实际问题中,不同的错误类型有着不同的代价,如在欺诈检测问题中,将一个非欺诈交易分类为欺诈交易的代价相较于将一个欺诈交易分类为非欺诈交易而言要大得多。因此,将传统的数据挖掘方法应用于成本敏感场景可能会导致对代价高的错误类型处理不足。此项研究旨在利用成本敏感的数据挖掘算法来解决此类问题。 任务重点: 1.回顾现有的成本敏感的数据挖掘算法,包括但不限于代价敏感决策树、代价敏感支持向量机、代价敏感朴素贝叶斯和代价敏感规则学习等算法; 2.研究和探究成本敏感方法在实际场景中的应用,包括但不限于欺诈检测、医学诊断、图像分类等领域; 3.通过实验分析不同的成本敏感算法在不同应用场景中的表现和优缺点; 4.最终结论应该包括成本敏感数据挖掘算法的应用场景、影响算法表现的因素以及如何选择合适的成本敏感算法等等。 研究目标: 1.回顾成本敏感的数据挖掘算法领域,了解当前存在的研究热点和难点; 2.研究成本敏感方法的实际应用,了解成本敏感算法在不同领域的表现和实际的效果; 3.探索成本敏感算法的优化方向和未来的发展趋势; 4.为实际成本敏感问题提供可行的解决方案。 主要任务: 1.查找和收集有关cost-sensitive算法的相关文献并进行综述; 2.选取不同的成本敏感算法,完成各类场景数据挖掘的实现; 3.分析各种算法的优缺点,并且根据不同的应用场景选择合适的算法进行实际线上实验; 4.实现相应算法的程序,并对实验数据进行评估和比较; 5.总结成本敏感算法的应用场景和影响因素,进一步升华成研究结果。 预期产出: 1.成果论文一篇; 2.代码实现及对应数据文件。 参考文献: 1.ZhangML,etal.Cost-sensitiveboostingforclassificationofimbalanceddata.DataMinKnowlDiscov,2006,13(1):83-114. 2.ElkanC,etal.Learningclassifiersfromonlypositiveandunlabeleddata.Proc.ofthe14thAcmSigkdd,NewYork,2008:213-220. 3.ZhouZH,etal.Multi-instancecost-sensitivelearningwithoutsampling.KnowlInformSyst,2014,41(1):1-25. 4.WangS,etal.Cost-sensitivediscriminantfeatureselectionforplantleafidentification.IEEETransImageProcess,2013,22(10) 5.LiZ,etal.Acost-sensitiveclassificationapproachusingfuzzySVMforcreditrating.ExpertSystemsWithApplications,2011,38(4)