问题描述

  1. 需监控业务资源量大、运维成本高,监控运维支持人员有限。

  2. 基于各类资源上所部署业务的不同,对资源监控管理的需求也有区别,需要从资源层进行分组分类管理。

  3. 监控运维工作操作路径分散,无法进行发现问题-定位问题-解决问题全链路的运维监控工作。

解决方案

  1. 利用监控 Dashboard 的自定义监控面板创建所有 IaaS、PaaS 资源的统一监控界面。

  2. 对资源进行分组监控,根据业务系统的不同分组,实施精准高效的故障处理流程,迅速追溯到故障资源组。

  3. 针对云资源中不同数据类型的监控告警服务进行统一管理,快速对关键事件和核心指标进行告警策略的设置。

方案优势

  1. 运用监控系统中的各类功能实现集中监控的业务需求。

  2. 流程完善、功能全面,可覆盖大多数基础资源的运维需求。

  3. 可满足集中全局统览与详细追溯具体资源两方面的监控场景,实现云平台的全量监控服务。