预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共12页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN113822336A(43)申请公布日2021.12.21(21)申请号202110962511.1(22)申请日2021.08.20(71)申请人济南浪潮数据技术有限公司地址250101山东省济南市自由贸易试验区济南片区浪潮路1036号浪潮科技园S05楼S311室(72)发明人雷跃辉沈新新江治林(74)专利代理机构北京集佳知识产权代理有限公司11227代理人张雪娇(51)Int.Cl.G06K9/62(2006.01)G06N20/00(2019.01)权利要求书2页说明书8页附图1页(54)发明名称一种云硬盘故障预测方法、装置、系统及可读存储介质(57)摘要本发明公开了一种云硬盘故障预测方法、装置、系统及计算机可读存储介质,包括:获取当前时刻的SMART信息;采用预先建立的云硬盘故障预测模型对当前时刻的SMART信息进行分析,得到包含云硬盘状态等级的预测结果;其中,云硬盘故障预测模型的建立过程为:采用随机森林算法对各个原始历史SMART信息进行特征选择,确定出各个重要特征;将各个原始历史SMART信息中的各个重要特征保留,得到SMART信息样本集;采用机器学习算法对SMART信息样本集进行训练,得到云硬盘故障预测模型;本发明中所建立的云硬盘故障预测模型的更加精确,有利于提高云硬盘故障预测准确率,预测效果更好。CN113822336ACN113822336A权利要求书1/2页1.一种云硬盘故障预测方法,其特征在于,包括:获取当前时刻的SMART信息;采用预先建立的云硬盘故障预测模型对所述当前时刻的SMART信息进行分析,得到包含云硬盘状态等级的预测结果;其中,所述云硬盘故障预测模型的建立过程为:采用随机森林算法对各个原始历史SMART信息进行特征选择,确定出各个重要特征;将各个所述原始历史SMART信息中的各个所述重要特征保留,得到SMART信息样本集;采用机器学习算法对所述SMART信息样本集进行训练,得到云硬盘故障预测模型。2.根据权利要求1所述的云硬盘故障预测方法,其特征在于,在所述采用随机森林算法对各个原始历史SMART信息进行特征选择,确定出各个重要特征之前,还包括:对每个原始历史SMART信息进行数值化和归一化处理,得到各个第一历史SMART信息;则,所述采用随机森林算法对各个原始历史SMART信息进行特征选择,确定出各个重要特征的过程为:采用随机森林算法对各个所述第一历史SMART信息进行特征选择,确定出各个重要特征。3.根据权利要求2所述的云硬盘故障预测方法,其特征在于,在对所述对每个历史SMART信息进行数值化和归一化处理之前,还包括:对每个原始历史SMART信息中存在缺失值的历史SMART信息进行缺失值填补处理,得到处理后的每个第二历史SMART信息;则,所述对每个原始历史SMART信息进行数值化和归一化处理的过程为:对每个所述第二历史SMART信息进行数值化和归一化处理。4.根据权利要求3所述的云硬盘故障预测方法,其特征在于,所述对每个原始历史SMART信息中存在缺失值的历史SMART信息进行缺失值填补处理的过程为:从每个所述原始历史SMART信息确定出存在缺失值的目标原始历史SMART信以及对应的目标特征;根据与所述目标原始历史SMART信息对应的上一时刻的原始历史SMART信息以及下一时刻的原始历史SMART信息中与所述目标特征对应的特征值计算出所述目标原始历史SMART信息的目标特征的缺失值;将所述缺失值作为所述目标原始历史SMART信息的目标特征的特征值进行填写。5.根据权利要求2所述的云硬盘故障预测方法,其特征在于,在所述采用随机森林算法对各个所述第一历史SMART信息进行特征选择,确定出各个重要特征之后,还包括:依据与每个所述第一历史SMART信息各自对应的状态等级,从各个所述第一历史SMART信息中确定出各个正常的第一历史SMART信息以及各个非正常的第一历史SMART信息;其中,所述各个非正常的第一历史SMART信息构成负样本集,所述非正常的第一历史SMART信息为负样本;针对所述负样本集中的每个负样本,计算出所述负样本至其他每个负样本的欧氏距离,并依据各个所述欧氏距离确定出与所述负样本相关的各个临近负样本;从与所述负样本对应的各个临近负样本中选择出预设数量的目标临近负样本;依据所述负样本及与其对应的各个目标临近负样本构建出与每个所述目标临近负样本各自对应的新负样本;2CN113822336A权利要求书2/2页将各个所述新负样本及各个正常的第一历史SMART信息构成的样本集作为新的SMART信息样本集;则,采用机器学习算法对所述SMART信息样本集进行训练,得到云硬盘故障预测模型的过程为:采用机器学习算法对所述