QKE 监控告警是通过云监控服务 CloudSat 为集群服务器的资源和服务提供监控告警管理。当绑定的监控项超过阈值时将触发告警,并通过短信、邮件等形式发送告警通知。

本小节介绍如何创建及绑定指标告警策略。配置告警通知策略请参见配置告警通知策略

背景信息

  • 支持的告警监控项:CPU利用率内存使用率磁盘使用量节点服务状态正在运行的容器数量

  • 支持的监控周期:1分钟5分钟

操作步骤

  1. 登录 QingCloud 管理控制台。

  2. 在控制台顶部的导航菜单中,选择产品与服务 > 容器服务 > 容器引擎 QKE,进入 QKE 集群列表页面。

  3. 点击目标集群 ID 号,进入集群详情页面。

  4. 点击告警页签,进入告警配置页面。

    告警页面

绑定指标告警策略

  1. 告警页签,勾选需要配置的节点,点击绑定指标告警策略

    选择要绑定的告警策略
  2. 选择已创建的告警策略,点击提交

    若还未创建有告警策略或已有告警策略不合适,请参见创建指标告警策略进行新建。

    说明

    每个节点只能绑定一个指标告警和一个事件告警。

创建指标告警策略

  1. 告警页签,勾选节点,点击绑定指标告警策略 > 创建指标告警策略

  2. 创建告警策略页面,配置告警基本参数。

    create warning policy 1

    名称 :输入告警策略名称。

    对象范围 :默认为平台监控

    告警类型 :默认为指标告警,即对集群指标进行监控告警。

    资源类型 :默认为集群节点

    监控周期 :可选择1分钟5分钟5分钟粒度为免费使用,1分钟粒度将收取费用。

  3. 点击下一步,配置告警规则。

    create warning policy 2

    点击添加规则,并可配置指标规则阈值和告警级别,一个策略可添加多条指标规则。

    说明

    有多条指标规则时,任何一条规则满足条件都会触发告警。

  4. 点击下一步,配置告警行为。

    create warning policy 3

    发送通知 :选择是否发送告警通知。

    触发条件 :选择告警触发条件,可选择资源变为告警时资源恢复正常时

    告警次数 :当资源持续处于告警状态时,连续发送告警通知的次数。最多为100次。

    通知列表 :选择告警通知列表。可点击新列表创建新的通知列表。

  5. 确认配置无误后,点击提交,返回指标告警策略配置窗口,即可选择新创建的告警策略。

    说明

    若需要删除或修改告警策略,请点击管理告警策略进入云监控 CloudSat 的平台告警策略页面进行操作,具体说明请参见云监控 CloudSat 告警服务