一、配置告警规则

1、依次点击【监控】-【PrometheusRule】-【创建】

image-20250114154137378

2、新增名为node-monitor的PrometheusRule,具体修改内容如下:

规则组1:

  • 组名称:node-monitor

告警规则:

  • 告警名称:NodeMemoryLow
  • PromQL表达式:node_memory_MemFree_bytes / 1024 / 1024 < 800

标签:

  • 严重程度:警告
  • 键(值):cluster_id(c-m-wnvkxplb)、cluster_name(prod)、media(email)、namespace(cattle-monitoring-system)、type(node)

注释:

  • 概述:节点内存不足
  • 描述:主机:{{$labels.instance}}内存不足.当前内存:{{$value}}

image-20250114160953034

image-20250114161143107

3、依次点击【监控】-【PrometheusRules】,查看告警规则已经匹配成功

image-20250114161439825

image-20250114161637622

4、在此页面点击【Alerts】,也可以进行验证告警规则

image-20250114161846644

二、配置AlertmanagerConfig

1、依次点击【监控】-【AlertmanagerConfig】-【创建】

image-20250114162613999

2、定义下面内容后,点击【创建】

  • 名称:email-alert
  • 描述:通过邮件告警

image-20250114162836153

3、点击【编辑配置】后,选择【添加接收器】

image-20250114163133442

4、创建Opaque类型的secret,定义下面内容:

  • 名称:email-key
  • 键:emailkey
  • 值:ERgVuk9XPpEtkAhK

image-20250114164219869

image-20250114164659776

5、选择【电子邮件】,填写下面内容

名称:email

Target

  • Default Recipient Address:xiaozhang_vip123@163.com
  • 勾选【Enable send resoved alerts】

SMTP:xiaozhang_vip123@163.com

Host:smtp.163.com:25

认证用户名:xiaozhang_vip123@163.com

具有Auth密码的密文:email-key

image-20250116092621215

6、定义下面内容来进行添加路由

Receiver:email

Grouping:type

重复间隔:1h

Matchers:

  • 名称:media
  • 值:email
  • 匹配类型:Match Equal

image-20250114170051046

7、添加完成后,等待几分钟后就可以在邮箱内查看到告警信息。