预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共16页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113761307A(43)申请公布日2021.12.07(21)申请号202011351263.9(22)申请日2020.11.25(71)申请人北京沃东天骏信息技术有限公司地址100176北京市北京经济技术开发区科创十一街18号院2号楼4层A402室申请人北京京东世纪贸易有限公司(72)发明人祖辰杨立军(74)专利代理机构中原信达知识产权代理有限责任公司11219代理人郝红玉冯培培(51)Int.Cl.G06F16/906(2019.01)权利要求书2页说明书9页附图4页(54)发明名称一种特征选择方法和装置(57)摘要本发明公开了一种特征选择方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:确定各样本中的特征,基于所有特征在各个样本中的值构建样本向量;利用全局冗余最小化的稀疏特征选择算法处理所述样本向量,得到重要性评分向量;从所述各特征的重要性评分中,提取重要性评分最大的预定数目个特征,以作为所选择的目标特征。该实施方式提出的全局冗余最小化的稀疏特征选择算法GRMS,以最小化全局特征的冗余性、选择具有强判别性的特征,实现对稀疏选择的特征进行修正。CN113761307ACN113761307A权利要求书1/2页1.一种特征选择方法,其特征在于,包括:确定各样本中的特征,基于所有特征在各个样本中的值构建样本向量;其中,样本为图像、文本、语音数据中的至少一种;利用全局冗余最小化的稀疏特征选择算法处理所述样本向量,得到重要性评分向量;其中,重要性评分向量包括各特征的重要性评分;从所述各特征的重要性评分中,提取重要性评分最大的预定数目个特征,以作为所选择的目标特征。2.根据权利要求1所述的方法,其特征在于,所述利用全局冗余最小化的稀疏特征选择算法处理所述样本向量,包括:确定各样本所属的类别,将所述样本向量、所述类别、第一重要性评分向量、第二重要性评分向量和冗余矩阵,一同输入到全局冗余最小化的稀疏特征选择算法中进行最小化;其中,所述第一重要性评分向量未考虑冗余性,所述第二重要性评分向量考虑冗余性;以及对所述第二重要性评分向量中的元素进行约束;其中,约束条件为元素非0,并且和为1;得到最小化且约束元素后的第二重要性评分向量。3.根据权利要求1所述的方法,其特征在于,所述利用全局冗余最小化的稀疏特征选择算法处理所述样本向量,得到重要性评分向量,包括:通过评价准则处理所述样本向量,以计算各特征未考虑冗余性时的第一重要性评分,生成第一重要性评分向量;引入冗余矩阵,并将所述第一重要性评分向量输入冗余信息最小化准则中,以对不同特征进行去冗余性修正,得到第二重要性向量。4.根据权利要求2或3所述的方法,其特征在于,还包括:将一特征在不同样本中的值进行归一化,以构建所述一特征的特征向量;计算两两特征的特征向量之间的内积,以构建所述两两特征之间的冗余矩阵。5.根据权利要求4所述的方法,其特征在于,所述将一特征在不同样本中的值进行归一化,以构建所述一特征的特征向量,包括:根据一特征在不同样本中的值,构建数据矩阵;利用中心化矩阵处理所述数据矩阵,得到与所述一特征对应的中心化后的特征向量。6.一种特征选择装置,其特征在于,包括:特征确定模块,用于确定各样本中的特征,基于所有特征在各个样本中的值构建样本向量;其中,样本为图像、文本、语音数据中的至少一种;向量处理模块,用于利用全局冗余最小化的稀疏特征选择算法处理所述样本向量,得到重要性评分向量;其中,重要性评分向量包括各特征的重要性评分;特征选择模块,用于从所述各特征的重要性评分中,提取重要性评分最大的预定数目个特征,以作为所选择的目标特征。7.根据权利要求6所述的装置,其特征在于,所述向量处理模块,用于:确定各样本所属的类别,将所述样本向量、所述类别、第一重要性评分向量、第二重要性评分向量和冗余矩阵,一同输入到全局冗余最小化的稀疏特征选择算法中进行最小化;其中,所述第一重要性评分向量未考虑冗余性,所述第二重要性评分向量考虑冗余性;以及2CN113761307A权利要求书2/2页对所述第二重要性评分向量中的元素进行约束;其中,约束条件为元素非0,并且和为6;得到最小化且约束元素后的第二重要性评分向量。8.根据权利要求7所述的装置,其特征在于,还包括冗余矩阵构建模块,用于:将一特征在不同样本中的值进行归一化,以构建所述一特征的特征向量;计算两两特征的特征向量之间的内积,以构建所述两两特征之间的冗余矩阵。9.一种电子设备,其特征在于,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-5中任一所述的方法。10.一种计算机可读介质,