预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN111240915A(43)申请公布日2020.06.05(21)申请号202010020945.5(22)申请日2020.01.09(71)申请人北京大学地址100871北京市海淀区颐和园路5号北京大学(72)发明人杨洪章杨雅辉(74)专利代理机构北京君尚知识产权代理有限公司11200代理人司立彬(51)Int.Cl.G06F11/22(2006.01)G06N20/00(2019.01)权利要求书2页说明书8页附图1页(54)发明名称一种面向硬盘故障预测的特征选择方法及硬盘故障预测方法(57)摘要本发明公开了一种面向硬盘故障预测的特征选择方法及硬盘故障预测方法。本发明特征选择方法包括:1)以设定时间间隔T采集所选w块硬盘的SMART信息p次;所述SMART信息为硬盘的N维特征信息;2)分别计算每一维特征p次采集的特征值的方差或标准差,过滤掉方差或标准差小于设定阈值y的M个特征,保留剩余的N-M个特征;3)选用x种算法对所保留的N-M个特征分别进行重要程度的排序,生成x个序列;4)计算所保留的每一特征在各序列中位置的平均值,根据平均值对特征进行排序,生成序列b;5)从该序列b中选取前k个特征并测试每次所选特征所建预测模型的召回率,将召回率最大值对应的所选特征作为最终的特征筛选结果。CN111240915ACN111240915A权利要求书1/2页1.一种面向硬盘故障预测的特征选择方法,其步骤包括:1)以设定时间间隔T采集所选w块硬盘的SMART信息p次;所述SMART信息为硬盘的N维特征信息;2)分别计算每一维特征p次采集的特征值的方差或标准差,过滤掉方差或标准差小于设定阈值y的M个特征,保留剩余的N-M个特征;3)选用x种算法对所保留的N-M个特征分别进行重要程度的排序,生成x个序列;4)计算所保留的每一特征在各序列中位置的平均值,根据平均值对特征进行排序,生成序列b;5)从该序列b中选取前k个特征并测试基于每次所选特征所建预测模型的召回率,将召回率最大值对应的所选特征作为最终的特征筛选结果。2.如权利要求1所述的特征选择方法,其特征在于,确定最终所选特征的方法为:采用枚举法选取序列b的前k个特征,先取k=1,对当前所选特征进行建模并测试当前所建预测模型的召回率为recall1;再取k=2,对特征进行建模,并测试当前所建预测模型的测试召回率为recall2……以此类推,直至k=N-M,并测试当前所建预测模型的测试召回率为recallN-M;然后比较recall1、recall2...recallN-M,找出其中的最大值,记为recallt,则将recallt对应的所选特征作为最终的特征筛选结果。3.如权利要求1或2所述的特征选择方法,其特征在于,如果存在多个相同最大召回率,则比较各最大召回率对应的所选特征个数,选取所选特征个数最多的特征作为最终的特征筛选结果。4.如权利要求1所述的特征选择方法,其特征在于,对所保留的N-M个特征按照其对应的平均值由小至大进行排序,得到序列b。5.如权利要求1所述的特征选择方法,其特征在于,所述x种算法包括但不限于下列算法:基于卡方检验算法、基于逻辑回归算法、基于支持向量分类算法、基于随机森林算法、基于梯度提升迭代决策树算法、经验判断、可视化观察法。6.如权利要求1所述的特征选择方法,其特征在于,所述w块硬盘的品牌、型号均相同。7.一种硬盘故障预测方法,其步骤包括:1)以设定时间间隔T采集所选w块硬盘的SMART信息p次;所述SMART信息为硬盘的N维特征信息;2)分别计算每一维特征p次采集的特征值的方差或标准差,过滤掉方差或标准差小于设定阈值y的M个特征,保留剩余的N-M个特征;3)选用x种算法对所保留的N-M个特征分别进行重要程度的排序,生成x个序列;4)计算所保留的每一特征在各序列中位置的平均值,根据平均值对特征进行排序,生成序列b;5)从该序列b中选取前k个特征并测试基于每次所选特征所建预测模型的召回率,将召回率最大值对应的预测模型作为硬盘故障预测模型,对应的特征作为预测特征;6)将待测硬盘的预测特征输入所述硬盘故障预测模型,得到该待测硬盘的预测结果。8.如权利要求7所述的硬盘故障预测方法,其特征在于,如果存在多个相同最大召回率,则比较各最大召回率对应的所选特征个数,选取所选特征个数最多的特征作为最终的特征筛选结果。2CN111240915A权利要求书2/2页9.如权利要求7所述的硬盘故障预测方法,其特征在于,所述w块硬盘以及待测硬盘的品牌、型号均相同。3CN111240915A说明书1/8页一种面向硬盘故障预测的特征选择方法及硬盘故障预测方法技术领域[0001]本发明属于人工智能领域,涉及一种特征选择方法