ELK 监控告警是通过云监控告警服务为集群的资源和服务提供监控管理。当集群监控项超过阈值时触发告警,并通过短信、邮件等形式发送告警通知。

云监控 CloudSat,可对 ELK 的运行状态进行日常监控。您可以通过 CloudSat 管理控制台,一站式监控和告警 ELK 各类服务、资源指标。您可以在 ELK 集群详情页面,查看主实例监控和查看备实例监控。

注意

由于云监控 CloudSat 默认监控扫描周期为5分钟,则当前显示5~10分钟前的集群状态。

前提条件

  • 已获取管理控制台登录账号和密码,且已获取集群查看权限。

  • 已创建 ELK 集群,集群状态为活跃,且服务状态为正常

    说明

    更新中、异常、删除状态的集群,无法获取其监控指标。当集群重启或恢复后,即可正常查看。

  • 集群服务已正常运行一段时间。

    说明

    监控扫描周期默认为5分钟,新增节点暂无法查看监控信息。

查看监控指标

  1. 在集群管理页面,点击目标集群 ID,进入集群详情页面。

  2. 节点页签,选中目标节点监控

    • 通过切换服务资源,可分别查看对应节点服务和资源监控指标状态。

    • 通过切换时间区段,可分别查看不同时间段内集群性能状态。
      可选中最近6小时最近一天最近两周最近一个月最近6个月

    • 您也可以通过自定义连续7天的起止时间,查看目标时间段内指标状态。
      但最多仅能查询近 90 天内数据。

查看实时监控

  1. 在集群管理页面,点击目标集群 ID,进入集群详情页面。

  2. 节点页签,选中目标节点监控

  3. 查看实时服务指标状态。
    切换到服务指标,点击关闭状态按钮,开启实时监控。

    说明

    开启一个服务指标实时监控,默认开启全部服务指标实时监控。

  4. 查看实时资源指标状态。
    切换到资源指标,点击关闭状态按钮,开启实时监控。

    说明

    每一个资源指标实时监控,需单独开启。