预览加载中,请您耐心等待几秒...
1/2
2/2

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

基于特征加权与特征选择的数据挖掘算法研究的中期报告 一、研究背景 现今数据挖掘被广泛应用于各种领域。数据挖掘技术在大数据环境下的应用,是实现智能决策和发现商业价值的重要手段。而数据挖掘过程中,特征选择和特征加权是不可或缺的环节。特征选择可以用于削减噪声、提升分类性能、减小计算复杂度等。而特征加权可以用于对不同特征对分类的重要程度进行赋权,进一步提升分类准确率。因此,本研究旨在探究基于特征加权与特征选择的数据挖掘算法。 二、研究目标 本研究的主要目标是: 1.比较各种特征选择方法的效果,并提出适应大数据量、高维度的特征选择方法; 2.通过对各特征的交叉验证分类后,提出适应大数据量、高维度的特征加权方法; 3.基于所提方法,将其应用到真实数据集上,验证其实用性与性能。 三、研究内容 1.对各种现有特征选择方法进行总结和比较,提出适应大数据量、高维度的特征选择方法; 2.提出一种基于交叉验证的特征加权方法,以权重的形式得出各特征对分类结果的影响程度; 3.利用所提方法,对真实数据集进行分类实验,并评估算法性能。 四、研究方法 本研究将采取以下方法进行研究: 1.收集各种特征选择方法并进行比较,分析其优缺点并提出改进方法; 2.提出一种基于交叉验证的特征加权方法,对各特征的影响程度进行计算; 3.进行实验,对真实数据集进行分类测试并评估算法性能。 五、研究进度安排 本研究计划于2021年7月至10月完成以下阶段的工作: 1.收集文献,总结和比较各种特征选择方法,提出适应大数据量、高维度的特征选择方法; 2.提出基于交叉验证的特征加权方法,对各特征进行加权处理; 3.进行实验,验证所提方法的实用性和性能。