预览加载中,请您耐心等待几秒...
1/8
2/8
3/8
4/8
5/8
6/8
7/8
8/8

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN107577457A(43)申请公布日2018.01.12(21)申请号201710791401.7(22)申请日2017.09.05(71)申请人中国电子科技集团公司第四十一研究所地址266000山东省青岛市黄岛区香江路98号(72)发明人吕子敬韩顺利张志辉刘磊张鹏(74)专利代理机构北京天奇智新知识产权代理有限公司11340代理人陈永宁(51)Int.Cl.G06F8/30(2018.01)权利要求书1页说明书4页附图2页(54)发明名称一种改进的基于Markovblanket红外光谱特征选择算法(57)摘要本发明提供一种改进的基于Markovblanket红外光谱特征选择算法,步骤1:计算候选特征集S中所有特征fn与类标签C的相关性度量值SU,找出SU最大的值作为初始权重w(f),并把SU值最大的特征f加入到已选特征集W中,删除候选特征集S中的此特征;步骤2:以新加入到已选特征集W的特征f作为条件计算所有特征fn的条件相关性度量值CSU的值,找出初始权重w(f)与CSU相乘后的最大值,并把该值作为新的权重,同时把新的最大权重值对应的特征f选入已选特征集W中;步骤3:直到候选特征集S为空,从而获取到最优特征空间Sbest。采用上述方案,更好的保留内部成员相互关联的改进的基于Markovblanket红外光谱特征选择算法。CN107577457ACN107577457A权利要求书1/1页1.一种改进的基于Markovblanket红外光谱特征选择算法,其特征在于,包括以下步骤:步骤1:计算候选特征集S中所有特征fn与类标签C的相关性度量值SU,找出SU最大的值作为初始权重w(f),并把SU值最大的特征f加入到已选特征集W中,删除候选特征集S中的此特征;步骤2:以新加入到已选特征集W的特征f作为条件计算所有特征fn的条件相关性度量值CSU的值,找出初始权重w(f)与CSU相乘后的最大值,并把该值作为新的权重,同时把新的最大权重值对应的特征f选入已选特征集W中,并将该特征从候选特征集S中删除;步骤3:运用近似MarkovBlanket删除已选特征集W中冗余性较高的特征,直到候选特征集S为空,从而获取到最优特征空间Sbest。2CN107577457A说明书1/4页一种改进的基于Markovblanket红外光谱特征选择算法技术领域[0001]本发明属于红外光谱特征选择技术领域,尤其涉及的是一种改进的基于Markovblanket红外光谱特征选择算法。背景技术[0002]在当今的信息化时代,信息技术日新月异,计算机应用不断更新,红外光谱数据集的规模也就随之而不断扩大,然而,由于光谱数据集中往往存在着大量的冗余信息,这些冗余信息对机器学习算法的执行效率产生了重要的影响,去除光谱数据集中的冗余信息就成为了特征选择算法所要解决的关键问题。特征选择算法的应用领域非常广泛,最突出的就是应用在物质分析领域,例如:特征选择算法可应用于红外光谱分析仪的红外光谱特征提取的过程,此算法能够更加准确的选择出原始光谱的目标信息,删除冗余信息,为后续准确的进行物质成分分析提供了强有力的保障。Filter型特征选择算法具有计算代价小、效率高、适用范围广的特点。目前,国内外学者所研究的很多高效Filter型特征选择算法普遍存在的一个问题是一些作为特征集具有较强的表达特性,但就其本身而言具有较弱表达特性的特征在选择过程中会被遗漏。其主要原因是:这些特征选择算法及其采用的信息度量方法忽略了特征的内部相关性。综上考虑,提出了改进的基于Markovblanket红外光谱特征选择算法(MBDWFS)。[0003]在现有技术中,论文“光谱数据挖掘中的特征提取方法”(天文学进展,第30卷第1期,第94-105页,2012年2月)介绍了一种光谱特征提取的方法——主成分分析法(PCA),该方法将已有的众多指标进行分解、重组,形成一系列线性无关的综合指标,并按照它们反映原始信号所蕴含信息的能力从高到低进行排序。在该文献中,作者采样一批不同天体的观测数据,构造该观测数据的协方差矩阵,然后采用该协方差矩阵的无偏估计进行PCA分析,获取该矩阵的所有特征值和其对应的特征向量,最后依据累积方差贡献率筛选出最优的特征空间,这样达到了数据压缩的目的,以利于高效的计算,并抑制噪声等干扰因素对物质分析结果的不利影响。缺点:现有技术在进行光谱的特征选择过程中遗漏掉了一些重要信息,这样会影响到后续物质分析的准确性。[0004]因此,现有技术存在缺陷,需要改进。发明内容[0005]本发明所要解决的技术问题是针对现有技术的不足,提供一种改进的基于Markovblanket红外光谱特征选择算法。[0006]本发明的技术方案如下:[