QKE 提供了基于集群级别及节点级别的监控数据收集与展示。通过监控数据,您可以快速查看集群及节点的资源使用情况。

集群监控指标

资源使用情况指标:

监控项 指标含义

CPU

统计 CPU 的使用率、已使用量及总量。

内存

统计内存的使用率、已使用量及总量。

容器组

统计容器组的使用率、已使用量及总量。

存储

统计存储的使用率、已使用量及总量。

物理资源监控指标:

监控项 单位/值 指标含义

CPU 使用率

%,整数[0, 100]

集群 CPU 使用率。

CPU 负载

>=0,整数

集群 CPU 使用量。

系统盘使用率

%,整数[0, 100]

集群系统盘使用率。

数据盘使用率

%,整数[0, 100]

集群所挂载数据盘的使用率。
托管版集群 Master 节点不挂盘,默认为 0。

内存使用率

%,整数[0, 100]

集群内存使用率。

apiserver 的连通性

  • 1:正常

  • 0:异常

集群 apiserver 是否能正常连通。
检查 Master 节点 6443 端口。如果持续 1 分钟为 0,表示 Master 节点有异常。

正在运行的 Pod 数量

>=0,整数

集群节点上运行的 Pod 数量。

节点监控指标

监控项 监控周期 单位 指标含义

CPU 用量

5分钟

%

统计 CPU 使用率。

内存用量

5分钟

%

统计内存使用率。

磁盘吞吐量

5分钟

KB/s

统计硬盘每秒读取及写入速率,可分别获取从硬盘读取或写入硬盘的速率。

磁盘 IOPS

5分钟

统计硬盘每秒读取或写入次数,可分别获取从硬盘读取或写入硬盘的次数。