预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共30页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

沈阳航空航天大学ShenyangAerospaceUniversity算法分析题目:基于K-近邻分类算法研究院系计算机学院专业计算机技术姓名学号指引教师1月摘要数据挖掘是机器学习领域内广泛研究知识领域,是将人工智能技术和数据库技术紧密结合,让计算机协助人们从庞大数据中智能地、自动地提取出有价值知识模式,以满足人们不同应用需要。K近邻算法(KNN)是基于记录分类办法,是数据挖掘分类算法中比较惯用一种办法。该算法具备直观、无需先验记录知识、无师学习等特点,当前已经成为数据挖掘技术理论和应用研究办法之一。本文重要研究了K近邻分类算法。一方面简要地简介了数据挖掘中各种分类算法,详细地阐述了K近邻算法基本原理和应用领域,另一方面指出了K近邻算法计算速度慢、分类精确度不高因素,提出了两种新改进办法。针对K近邻算法计算量大缺陷,构建了聚类算法与K近邻算法相结合一种办法。将聚类中K-均值和分类中K近邻算法有机结合。有效地提高了分类算法速度。针对分类精确度问题,提出了一种新距离权重设定办法。老式KNN算法普通采用欧式距离公式度量两样本间距离。由于在实际样本数据集合中每一种属性对样本贡献作用是不尽相似,普通采用加权欧式距离公式。本文提出一种新计算权重办法。实验表白,本文提出算法有效地提高了分类精确度。最后,在总结全文基本上,指出了有待进一步研究方向。核心词:K近邻,聚类算法,权重,复杂度,精确度ABSTRACTDataminingisawidelyfieldofmachinelearning,anditintegratestheartificialintelligencetechnologyanddatabasetechnology.Ithelpspeopleextractvaluableknowledgefromalargedataintelligentlyandautomaticallytomeetdifferentpeopleapplications.KNNisausedmethodindataminingbasedonStatistic.Thealgorithmhasbecomeoneofthewaysindataminingtheoryandapplicationbecauseofintuitive,withoutprioristatisticalknowledge,andnostudyfeatures.Themainworksofthisthesisisknearestneighborclassificationalgorithm.First,itintroducesmainlyclassificationalgorithmsofdatamininganddescriptstheoreticalbaseandapplication.Thispaperpointsoutthereasonsofslowandlowaccuracyandproposestwoimprovedways.InordertoovercomethedisadvantagesoftraditionalKNN,thispaperusetwoalgorithmsofclassificationandclusteringtoproposeanimprovedKNNclassificationalgorithm.Experimentsshowthatthisalgorithmcanspeedupwhenithasafeweffectsinaccuracy.Accordingtotheproblemofclassificationaccuracy,thepaperproposesanewcalculationofweight.KNNthetraditionalmethodgenerallyusedContinentaldistanceformulameasurethedistancebetweenthetwosamples.Astheactualsampledatacollectionineveryattributeofasampleofthecontributionisnotthesame,oftenusingtheweightedContinentaldistanceformula.Thispaperpresentsacalculationofweight,thatisweightedbasedonthecharacteristicsofKNNalgorithm.AccordingtothisExperimentsonartificialdatasetsshowthatthisalgorithmcanimprovetheaccuracyofclassification.L