Kafka 提供集群服务和资源性能监控指标和告警信息。

  • 服务监控指标可用于定位分析 Kafka 的性能。

  • 资源监控指标统计了云服务器的资源信息,如 CPU 使用率、硬盘 IOPS 情况等,可用于查看系统性能是否到达瓶颈。

说明

只会监控集群的服务和资源指标,不会收除集除监控指标外的其它数据。

支持的服务监控指标

监控项 监控周期 单位 指标含义

JVM HEAP 内存使用率

5分钟

%

监控 JVM 中内存的使用情况。

消息吞吐率

5分钟

个/秒

监控每秒消息的吞吐情况。

数据吞吐率

5分钟

bps

监控每秒消息的数据大小情况。

副本消息滞后量

5分钟

监控副本的最大滞后量。

ISR 伸缩速率

5分钟

个/秒

监控 ISR 伸缩速率。

管理统计

5分钟

统计管理节点数和离线分区数。

支持的资源监控指标

监控项 监控周期 单位 指标含义

CPU

5分钟

%

统计当前资源 CPU 使用率。
以 % 为单位。

内存

5分钟

%

统计当前资源内存使用率。
以 % 为单位。

硬盘使用率

5分钟

%

统计当前资源硬盘使用率。
以 % 为单位。

硬盘 IOPS

5分钟

counts/s

统计每秒资源硬盘 IOPS 读取或写入次数,可分别查看读取或写入监控指标。
以次每秒为单位。

硬盘吞吐量

5分钟

KB/秒

统计每秒资源硬盘读取或写入速率,可分表获取读取或写入速率。
以 KB 每秒为单位。