预览加载中,请您耐心等待几秒...
1/9
2/9
3/9
4/9
5/9
6/9
7/9
8/9
9/9

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)国家知识产权局(12)发明专利申请(10)申请公布号CN115934398A(43)申请公布日2023.04.07(21)申请号202211642693.5(22)申请日2022.12.20(71)申请人华中科技大学地址430074湖北省武汉市洪山区珞喻路1037号(72)发明人刘渝关云川周可李强李娟张海军(74)专利代理机构华中科技大学专利中心42201专利代理师夏倩(51)Int.Cl.G06F11/07(2006.01)权利要求书1页说明书5页附图2页(54)发明名称一种磁盘故障预测模型的构建方法及应用(57)摘要本发明公开了一种磁盘故障预测模型的构建方法及应用,属于磁盘故障预测技术领域,本发明将磁盘异构、模型老化、环境差异等因素视作数据异构这一因素进行处理,并将磁盘故障预测中的小样本问题看作处理数据异构所导致的结果,通过将采集到的磁盘样本集按照磁盘故障预测中不同因素所对应的属性(磁盘型号、服务器环境、采样时间)进行分层划分,得到多个所包含的故障样本数量基本相当的子样本集,能够很好的平衡数据异构问题和小样本问题,在此基础上,将划分得到的多个子样本集视作多任务,进行多任务学习,实现了多个域下的迁移学习,能够适应多问题混合存在的磁盘故障预测场景,预测精度较高。CN115934398ACN115934398A权利要求书1/1页1.一种磁盘故障预测模型的构建方法,其特征在于,包括以下步骤:S1、将在不同服务器环境下所采集的带标签的磁盘样本集,按照磁盘型号划分成多个第一子样本集;其中,所述磁盘样本集包括故障样本和非故障样本;S2、将故障样本数量大于预设数量N的每一个所述第一子样本集,按照服务器环境进一步进行划分,得到多个第二子样本集;S3、分别对故障样本数量大于N的每一个所述第二子样本集,将其中的样本按照采集时间的先后顺序进行排列,从第一个样本开始,每隔N个故障样本标记一个划分点,并按照所标记的划分点将第二子样本集进一步划分成多个第三子样本集;S4、将所得的各所述第三子样本集、以及未被进一步划分的各所述第一子样本集和各所述第二子样本集共同构成一组子任务集,并将每一个所述子任务集均划分为支持集和查询集;S5、为每一个所述子任务集均分配一个与所述磁盘故障预测模型相同的子任务模型,并对各所述子任务模型分别采用对应的所述子任务集中的支持集进行训练;S6、分别将每一个所述子任务集中的查询集输入到对应的所述子任务模型中,计算得到每一个所述子任务模型的分类损失值;基于各所述子任务模型的分类损失值之和对所述磁盘故障预测模型中的参数进行更新;S7、重复步骤S5‑S6进行迭代,直至所述磁盘故障预测模型达到收敛。2.根据权利要求1所述的磁盘故障预测模型的构建方法,其特征在于,所述磁盘样本为磁盘SMART数据。3.根据权利要求1所述的磁盘故障预测模型的构建方法,其特征在于,所述预设数量N取值为70。4.根据权利要求1‑3任意一项所述的磁盘故障预测模型的构建方法,其特征在于,各所述子任务模型的训练过程并行执行。5.一种磁盘故障预测方法,其特征在于,包括以下步骤:获取多个带故障类型标签的磁盘样本,构成预测支持集;其中,所述预测支持集中的磁盘样本与待预测磁盘样本所对应的磁盘型号相同,所处的服务器环境相同,采集时间间隔在预设时间间隔内;采用所述预测支持集对采用权利要求1‑4任意一项所述的磁盘故障预测模型的构建方法构建的磁盘故障预测模型进行微调后,将所述待预测磁盘样本输入到所述磁盘故障预测模型中,以对所述待预测磁盘是否发生故障进行预测。6.一种磁盘故障预测系统,其特征在于,包括:存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时执行权利要求5所述的磁盘故障预测方法。7.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的计算机程序,其中,在所述计算机程序被处理器运行时控制所述存储介质所在设备执行权利要求1‑4任意一项所述的磁盘故障预测模型的构建方法和/或权利要求5所述的磁盘故障预测方法。2CN115934398A说明书1/5页一种磁盘故障预测模型的构建方法及应用技术领域[0001]本发明属于磁盘故障预测技术领域,更具体地,涉及一种磁盘故障预测模型的构建方法及应用。背景技术[0002]随着信息产业的发展,大量的数据不断生成,推动了数据存储服务的发展。存储系统的稳定性与服务供应商的效益密切相关,存储系统故障会给使用者造成巨大损失。大多数存储系统故障都来源于磁盘的故障,因此,对磁盘是否发生故障进行预测,提高磁盘的可靠性是必要且重要的。[0003]随着机器学习技术的发展与应用,机器学习模型被大量应用在磁盘故障预测领域中,基于机器学习的磁盘故障预测模型,通过磁盘的日志数据,即自我监测分析和报告技术(SAMRT),实现了较高的磁