Kafka 监控告警是通过云监控告警服务为集群服务器的资源和服务提供监控管理。当集群监控项超过阈值时触发告警,并通过短信、邮件等形式发送告警通知。

提供的云监控 CloudSat,可对 Kafka 的运行状态进行日常监控。您可以通过 CloudSat 管理控制台,一站式监控和告警 Kafka 各类服务、资源指标。

说明

由于云监控 CloudSat 默认监控扫描周期为 5 分钟,则当前显示 5~10 分钟前的集群状态。

前提条件

  • 已获取管理控制台登录账号和密码,且已获取集群查看权限。

  • 已创建 Kafka 集群,集群状态为活跃,且服务状态为正常

    说明

    更新中、异常、删除状态的集群,无法获取其监控指标。当集群重启或恢复后,即可正常查看。

  • 集群服务已正常运行一段时间。

    说明

    监控扫描周期默认为 5 分钟,新增节点暂无法查看监控信息。

查看监控指标

  1. 在集群管理页面,点击目标集群 ID,进入集群详情页面。

  2. 节点页签,选中目标节点监控

    • 通过切换服务资源,可分别查看对应节点服务和资源监控指标状态。

      注意

      客户端节点不支持服务指标监控数据。

    • 通过切换时间区段,可分别查看不同时间段内集群性能状态。

      可选中最近6小时最近一天最近两周最近一个月最近6个月

    • 您也可以通过自定义连续 7 天的起止时间,查看目标时间段内指标状态。

      但最多仅能查询近 90 天内数据。

    节点监控

查看实时监控

  1. 在集群管理页面,点击目标集群 ID,进入集群详情页面。

  2. 节点页签,选中目标节点监控

  3. 查看实时服务指标状态。

    切换到服务指标,点击右侧状态按钮,将状态置为开启,开启实时监控。

    说明

    开启其中一个服务指标实时监控时,默认将开启全部服务指标实时监控。

    实时监控为开启时

    manual service monitor realtime
  4. 查看实时资源指标状态。

    切换到资源指标,点击右侧状态按钮,将状态置为开启,开启实时监控。

    说明

    每一个资源指标实时监控,需单独开启。

    实时监控为开启时

    manual resource monitor realtime