预览加载中,请您耐心等待几秒...
1/10
2/10
3/10
4/10
5/10
6/10
7/10
8/10
9/10
10/10

亲,该文档总共11页,到这已经超出免费预览范围,如果喜欢就直接下载吧~

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

(19)中华人民共和国国家知识产权局(12)发明专利申请(10)申请公布号CN106100938A(43)申请公布日2016.11.09(21)申请号201610694727.3(22)申请日2016.08.19(71)申请人浪潮(北京)电子信息产业有限公司地址100085北京市海淀区上地信息路2号2-1号C栋1层(72)发明人张大帅周龙飞(74)专利代理机构北京集佳知识产权代理有限公司11227代理人罗满(51)Int.Cl.H04L12/26(2006.01)H04L12/24(2006.01)H04L29/08(2006.01)权利要求书1页说明书5页附图4页(54)发明名称一种分布式集群系统的监控和告警方法及系统(57)摘要本发明公开了一种分布式集群系统的监控和告警方法,包括:通过部署在各数据节点上的轮询搜集进程采集所在的数据节点的运行数据;通过部署在主节点上的轮询存储进程周期性地获取轮询搜集进程采集到的运行数据,并将运行数据存储于所在的主节点的数据库中;获取数据库中当前周期内的运行数据和所在主节点的配置文件中设定的阈值,并判断当前周期内的运行数据是否超过阈值;如果是,则输出告警提示信息。该方法简单,只需要利用数据库中的运行数据来判断即可,无需重新获取,并且数据真实可靠。由此可见,在实现监控的基础上,也实现了告警提示的目的。另外,本发明还公开一种分布式集群系统的监控和告警装置,效果如上所述。CN106100938ACN106100938A权利要求书1/1页1.一种分布式集群系统的监控和告警方法,其特征在于,包括:通过部署在各数据节点上的轮询搜集进程采集所在的数据节点的运行数据;通过部署在主节点上的轮询存储进程周期性地获取所述轮询搜集进程采集到的所述运行数据,并将所述运行数据存储于所在的主节点的数据库中;获取所述数据库中当前周期内的运行数据和所在主节点的配置文件中设定的阈值,并判断当前周期内的运行数据是否超过所述阈值;如果是,则输出告警提示信息。2.根据权利要求1所述的方法,其特征在于,当输出告警提示信息之后还包括:获取所述数据库中下一周期的运行数据,并判断所述下一周期的运行数据是否超过所述阈值;如果否,则输出恢复提示信息。3.根据权利要求1所述的方法,其特征在于,所述输出告警提示信息具体为:通过邮件或短信输出告警提示信息。4.根据权利要求2所述的方法,其特征在于,所述输出恢复提示信息具体为:通过邮件或短信输出恢复提示信息。5.根据权利要求1所述的方法,其特征在于,所述轮询存储进程的获取周期为15s。6.一种分布式集群系统的监控和告警系统,其特征在于,包括:监控模块和告警模块,其中,监控模块包括轮询搜集进程部署子模块和轮询存储进程部署子模块,所述告警模块包括判断子模块和告警提示子模块;所述轮询搜集进程部署子模块,用于在各数据节点上部署轮询搜集进程,并通过部署在各数据节点上的轮询搜集进程采集所在的数据节点的运行数据;所述轮询存储进程部署子模块,用于在主节点上部署轮询存储进程,并通过部署在主节点上的轮询存储进程周期性地获取所述轮询搜集进程采集到的所述运行数据,并将所述运行数据存储于所在的主节点的数据库中;所述判断子模块,用于获取所述数据库中当前周期内的运行数据和所在主节点的配置文件中设定的阈值,并判断当前周期内的运行数据是否超过所述阈值;如果是,则触发所述告警提示子模块;所述告警提示子模块,用于输出告警提示信息。7.根据权利要求6所述的系统,其特征在于,所述告警模块还包括恢复提示子模块,用于输出恢复提示信息;其中,所述判断子模块还用于获取所述数据库中下一周期的运行数据,并判断所述下一周期的运行数据是否超过所述阈值,如果否,则触发所述恢复提示子模块。8.根据权利要求6所述的系统,其特征在于,所述告警提示子模块具体通过邮件或短信输出告警提示信息。9.根据权利要求7所述的系统,其特征在于,所述恢复提示子模块具体通过邮件或短信输出恢复提示信息。10.根据权利要求6所述的系统,其特征在于,所述轮询存储进程的获取周期为15s。2CN106100938A说明书1/5页一种分布式集群系统的监控和告警方法及系统技术领域[0001]本发明涉及分布式集群系统技术领域,特别是涉及一种分布式集群系统的监控和告警方法及系统。背景技术[0002]分布式集群系统是指多台服务器或者主机通过网络互连形成一个集群系统,在该系统中,按照节点类型划分为主节点和数据节点。[0003]为了实现分布式集群系统的安全运行,现有技术中,采用监控模块实现对集群系统的性能和硬件状态指标实时的监控。监控模块的功能在于实时监控分布式集群中对应的各数据节点的各项指标数据,并将数据存储于数据库中。[0004]但是在具体实施中,不仅需要对集群系统的性能和硬件状态指标实时的监控,还需要在集群