预览加载中,请您耐心等待几秒...
1/6
2/6
3/6
4/6
5/6
6/6

在线预览结束,喜欢就下载吧,查找使用更方便

如果您无法下载资料,请参考说明:

1、部分资料下载需要金币,请确保您的账户上有足够的金币

2、已购买过的文档,再次下载不重复扣费

3、资料包下载后请先用软件解压,在使用对应软件打开

热点探究IT服务管理 IT集中监控系统的设计与实现 中国建设银行山东省分行徐崇岭张军明马文杰 在现代商业银行的日常营运中,各种IT应用系统对 业务开展起着至关重要的作用,IT应用系统的可用性和 运行的质量越来越受到重视。目前,各商业银行经过多 年的信息化建设,基本形成了以核心业务系统为主、专 用系统为辅的IT应用体系,为各类金融产品服务以及内 部业务管理工作提供了强有力的技术支撑。随着各商业 银行业务的快速发展和新系统的陆续投产,IT运行系统 将日渐庞大,运行维护压力越来越大。运行情况的集中、自动监控,提高对系统运行的分析、 由于服务和产品的多样化,商业银行现在使用的各管理能力,更好地满足现代商业银行对IT系统的应用要 应用系统的构成十分复杂,包含多种品牌的主机、存储求。 设备,各种类型的网络设备和金融机具,还采用了多种 版本的Unix、Windows等操作系统和各种中间件、数一、系统分析 据库产品,应用软件的种类更是十分繁多。各应用系统为保障商业银行IT系统的高可用性,要求运行维护 之间存在紧密、复杂的联系,部分系统还和银行合作伙人员加强系统监控和管理,提高运维效率。因此,建设 伴的IT系统之间存在关联。在这种紧密关联的复杂架构IT集中监控系统,就是要实现对IT系统“主动监控、集 中,任何环节出现故障,都可能导致整个体系的可用性中管理、统一运维”的目标,主动发现并定位IT系统中 降低,甚至崩溃,严重影响银行的服务质量。因此,加存在的故障和隐患,降低运行维护潜在的风险,为应用 强运维监控,及时发现并排除IT系统中存在的故障和隐系统的良好运行提供可靠的保障,进而提高工作效率, 患,保持应用系统的持续稳定运行,具有十分重要的意降低运维成本,减少营运损失,提升IT资产价值,系统建 义。设应满足以下要求。 目前,在IT系统的运行维护过程中,迅速发现故障(1)对网络、主机、数据库、中间件和应用系统等各 点或隐患,单靠人工操作是十分困难的,有必要利用IT类IT对象的状态和变化进行实时监控。 技术实现对IT运行环境、网络、主机系统、业务应用等(2)通过对采集的信息进行合理的过滤、压缩、分析 28中国金融电脑2008·4 热点探究IT服务管理 和关联,及时准确地生成故障报警、事件报告和性能提(4)便利性原则:系统的架构要清晰简单,维护和部 示,并提供灵活的视图展现。署、配置简便,并具备自管理功能,当系统自身运行状 (3)对采集到的事件和性能数据进行存储、预警、分态异常时,系统应能执行初步的动作以快速恢复。 析,形成管理服务的报告和报表。(5)可视化原则:在数据的组织上,应当以IT系统为 (4)对生产系统的各种资源进行管理。单位,组织所有相关IT系统的监控数据,并以树状结构 (5)对监控平台自身各部分的运转状态进行管理。分级展现各个组件的数据。 (6)通过角色、权限和功能的划分,实现不同用户的2.系统总体架构 安全访问管理。系统监控需包括数据采集、处理、加工、展现、管 (7)集中监控系统的使用不能降低生产系统自身的安理等过程,为使系统架构清晰,按照模块化、松耦合、 全性。分层的设计思想,系统的总体架构如图1所示。 (8)为运维管理平台等其他管理工具提供接口。整个系统架构分为五个层次,其中数据采集层、数 系统需实现对生产系统运行情况的采集、处理、据处理层、数据展现层为整个系统的核心层次,下面对 加工、汇总,集中反映各IT系统的运行、业务营运方面每个层次的功能及其所包含的模块进行说明。 的信息,并具备集中展现、管理定制等功能;在此基础(1)监控资源层 上,对IT系统的运行数据做出统计分析,预测关键数据主要是被监控的对象,包括主机系统、数据库、 的变化趋势,识别出对系统有重大影响的事件,为日常中间件、应用系统等;还包括其他监控工具,如网管系 维护管理和运营决策分析提供必要的依据。系统的建设统、场地监控系统等,其监控的信息由数据采集层采 应着重于及时发现各类告警和性能异常,提高运维人员集,并传递到数据处理层进行加工处理。 对各类事件的响应速度。(2)数据采集层 数据采集层由AgentServer模块和Agent模块组成, 二、系统设计主要功能是AgentServer模块按照采集策略,调度被监控 1.系统设计原则对象上的Agent模块采集和监控本地的资源信息、运行状 系统设计应符合商业银行统一的IT规划、技术规范态信息及业务指标数据,并由AgentServer模块中的事件 和数据标准,保证其先进性、实用性和可扩展性。主要检测引擎按相关事件规则对采集的数据进行初步分析, 遵循如下原则。及时发现事件,发送给数据处理层。 (1)高性能原则:主要从两个方面考虑,一方面是(3)数据处理层 系统的运行对被监控对象的影响降到最低,要占用被监数据处理