预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN112800224A(43)申请公布日2021.05.14(21)申请号202110116530.2G06N20/00(2019.01)(22)申请日2021.01.28G16H50/70(2018.01)(71)申请人中南大学地址410083湖南省长沙市岳麓区麓山南路932号(72)发明人刘丽珏吴小玉(74)专利代理机构长沙市融智专利事务所(普通合伙)43114代理人胡喜舟(51)Int.Cl.G06F16/35(2019.01)G06F16/383(2019.01)G06K9/62(2006.01)G06N3/00(2006.01)G06N3/12(2006.01)权利要求书3页说明书10页附图2页(54)发明名称基于改进蝙蝠算法的文本特征选择方法、装置及存储介质(57)摘要本发明公开了一种基于改进蝙蝠算法的文本特征选择方法、装置及存储介质,其中方法包括获取若干文本特征数据集,并对若干文本特征数据集进行预处理,得到若干初始文本特征向量;利用改进蝙蝠算法对若干文本特征向量进行迭代训练,得到多个精英文本特征子集。引入莱维飞行策略改进蝙蝠的位置更新方式,以确保单个蝙蝠不会被局限在最优蝙蝠的附近,即确保文本数据特征提取不会陷入局部最优解;每次迭代的适应度较低的几个蝙蝠实行差分进化,提高了蝙蝠的多样性和总体适应度;使用精英保留策略,可避免较优的解在迭代时消失,使精英蝙蝠始终保持全局最佳的几个蝙蝠的位置,在后续的特征集成过程中获得更好的集成效果。CN112800224ACN112800224A权利要求书1/3页1.一种基于改进蝙蝠算法的文本特征选择方法,其特征在于,包括:S1:获取若干文本特征数据集,并对若干文本特征数据集进行预处理,得到若干初始文本特征向量;S2:利用改进蝙蝠算法对若干文本特征向量进行迭代训练,得到多个精英文本特征子集;具体包括如下步骤:S21:初始化蝙蝠种群;S22:计算每个蝙蝠的适应度值;S23:根据每个蝙蝠的适应度值选取自适应度值最高的N个蝙蝠作为精英蝙蝠保留,其中N为预设值;S24:结合莱维飞行策略对非精英蝙蝠进行位置更新;S25:将适应度值最低的X个蝙蝠进行差分进化,其中X为预设值;S26:计算所有蝙蝠的适应度值,并据此更新精英蝙蝠;S27:重复步骤S24~S26直至完成预设迭代次数,得到N个精英蝙蝠,每个精英蝙蝠表示一个精英文本特征子集。2.根据权利要求1所述的基于改进蝙蝠算法的文本特征选择方法,其特征在于,所述步骤S21包括:设置蝙蝠种群个数为M,最大频率fmax,最小频率fmin,最大迭代次数Max_iteration,初始化蝙蝠种群的位置xi=(xi1,xi2,…,xid),初始化速度vi=(vi1,vi2,…,vid)和脉冲发射率ri0;其中,d为初始文本特征向量维度;xi表示第i个蝙蝠的位置,通过阈值将其转化为二进制位置,二进制位置中的值为1的表示当前位置的特征被选中,值为0表示当前位置的特征未被选中;vi表示第i个蝙蝠的速度。3.根据权利要求1所述的基于改进蝙蝠算法的文本特征选择方法,其特征在于,所述步骤S22包括:将分类算法的分类精度作为适应度函数来计算每个蝙蝠的适应度值,并找到最好的蝙蝠位置,即最优解x*。4.根据权利要求1所述的基于改进蝙蝠算法的文本特征选择方法,其特征在于,所述步骤S24包括:根据公式(1)‑(3)对非精英蝙蝠的频率、速度和位置进行更新,并限制其位置和速度在[‑1,1]范围;ft=fmin+(fmax‑fmin)×rand(1)vi(t+1)=vi(t)+(xi(t)‑x*)×ft(2)xi(t+1)=xi(t)+vi(t)(3)其中,fmin和fmax分别表示蝙蝠种群的最小频率和最大频率,t表示迭代次数,rand表示介于0到1之间的随机值,ft表示第t次迭代中蝙蝠种群的频率,vi(t)为第i只蝙蝠在第t次迭代中的速度,xi(t)表示第i只蝙蝠在第t次迭代中的位置,x*表示最好蝙蝠的位置,即最优解x*;产生随机数rand1,如果rand1>ri,则采用莱维飞行策略对蝙蝠xi进行位置更新,其中,ri表示当前迭代中的脉冲发射率;计算各蝙蝠的适应度值,如果存在xi更优于x*,当前蝙蝠i的位置更新为xi,并根据公式2CN112800224A权利要求书2/3页(6)更新脉冲辐射率ri,ri(t+1)=ri0[1‑exp(‑γt)](6)其中,ri0为初始脉冲发射率,γ为系数,其取值范围为γ>0;更新最优解x*。5.根据权利要求4所述的基于改进蝙蝠算法的文本特征选择方法,其特征在于,所述采用莱维飞行策略对蝙蝠xi进行位置更新包括:莱维飞行的位置更新公式如公式(4)所示:其中,Levy(θ)是服从莱维分布的