预览加载中,请您耐心等待几秒...
1/8
2/8
3/8
4/8
5/8
6/8
7/8
8/8

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN114117876A(43)申请公布日2022.03.01(21)申请号202111405009.7(22)申请日2021.11.24(71)申请人大连大学地址116622辽宁省大连市经济技术开发区学府大街10号(72)发明人周士华邹乐旺吕卉(74)专利代理机构大连智高专利事务所(特殊普通合伙)21235代理人毕进(51)Int.Cl.G06F30/25(2020.01)G06N3/00(2006.01)G06F111/08(2020.01)权利要求书2页说明书4页附图1页(54)发明名称基于改进哈里斯鹰算法的特征选择方法(57)摘要本发明公开了基于改进哈里斯鹰算法的特征选择方法,包括:随机构造初始的特征子集;通过改进哈里斯鹰优化算法对所述特征子集进行迭代寻优;利用目标函数获取哈里斯鹰特征子集的适应度,并确定其个体最优与全局最优;根据所述全局最优输出特征子集。本发明其将二阶分类错误率与特征子集长度的加权作为评估函数,通过改进哈里斯鹰优化算法迭代寻优,筛选出质量较佳的特征子集。CN114117876ACN114117876A权利要求书1/2页1.基于改进哈里斯鹰算法的特征选择方法,其特征在于,包括:随机构造初始的特征子集;通过改进哈里斯鹰优化算法对所述特征子集进行迭代寻优;利用目标函数获取哈里斯鹰特征子集的适应度,并确定其个体最优与全局最优;根据所述全局最优输出特征子集。2.根据权利要求1所述基于改进哈里斯鹰算法的特征选择方法,其特征在于,通过改进哈里斯鹰优化算法对所述特征子集进行迭代寻优,具体为:将每一个特征子集对应的看成一个粒子,设粒子在t时刻的位置为X(t),粒子的全局最优位置为gbest,粒子个体最优位置为pbest;当控制因子Cr值大于[0,1]间的随机数rand时,使用下式更新粒子位置:其中d代表粒子的维度,范围是[1,D]中的任意整数,这里的D是粒子搜索空间的总维度;rand是在区间(0,1)内均匀分布的随机数;i代表当前粒子的索引号;当控制因子Cr值小于等于【0,1]间的随机数rand时,使用下式更新粒子位置:Y=gbest‑E*(gbest‑Xi)(3)temp1=gbest‑α1*|gbest‑Xi|(5)temp2=mean_besti‑α2*|mean_besti‑Xi|(6)α=a*(2*rand‑1)(9)其中E是粒子的逃逸能量因子;α1、α2均为权重因子,由式(9)得到;mean_besti是从种群中比第i个粒子适应度好的前i‑1个粒子的历史最优适应度值中随机抽取k个,再作均值,如式(7)所示。3.根据权利要求2所述基于改进哈里斯鹰算法的特征选择方法,其特征在于,所述控制因子Cr值由式(10)获得,其中t为迭代次数,T为最大迭代次数:4.根据权利要求1所述基于改进哈里斯鹰算法的特征选择方法,其特征在于,将二阶分类错误率与特征子集长度加权形成目标函数,具体为:2CN114117876A权利要求书2/2页其中,sf代表所选择的特征子集长度;nf代表数据集中总共的特征数量;μ是平衡分类错误率与特征子集长度的平衡因子;balanced_error为分类错误率,fitness即为哈里斯鹰特征子集的适应度,对所述fitness进行排序得到个体最优与全局最优。5.根据权利要求4所述基于改进哈里斯鹰算法的特征选择方法,其特征在于,所述分类错误率balanced_error由下式计算得到:其中,n是问题的总类数,TPi是第i类中被正确分类的实例数,Si是第i类中包含的所有实例数。3CN114117876A说明书1/4页基于改进哈里斯鹰算法的特征选择方法技术领域[0001]本发明涉及特征选择技术领域,具体来说是针对分类不平衡问题,使用改进哈里斯鹰优化算法进行特征选择的方法。背景技术[0002]特征选择是机器学习领域数据预处理的重要方法之一。但由于特征选择本身的性质是个NP难问题,即特征数为n时,搜索空间为2n;导致研究者们只能退而求其次,使用近似算法获取特征选择问题的近似最优解,这也使得群体智能优化算法在特征选择问题中得到广泛应用。[0003]另一方面,由于数据集本身的特性,会导致部分分类数据样本远远少于其它分类数据,这将大大影响算法的分类准确性,而且仅仅考虑分类错误率会使得选择到的特征子集中包含较多的冗余特征,此时大大提高了算法的计算复杂度,这一点对于高维数据尤为明显。发明内容[0004]本发明针对分类不平衡问题,提出了基于改进哈里斯鹰优化算法的特征选择方法,其将二阶分类错误率与特征子集长度的加权作为评估函数,通过改进哈里斯鹰优化算法迭代寻优,筛选出质量较佳的特征子集。[0005]为实现上述目的,本申请提出基于改进哈里斯鹰算法的特征选择方法