张卿
2023-05-18
1000
24
0
Alertmanager 是 Prometheus 告警链路中的通知中枢,负责对 Prometheus 发送过来的告警进行去重、聚合、路由和通知。本文从基本概念和核心功能入手,帮助你先建立对 Alertmanager 的整体认知。
张卿
2023-05-17
784
24
0
在掌握基础查询语法之后,真正决定 PromQL 表达力的是操作符和函数。本文围绕算术、比较、逻辑运算以及聚合、排序、预测和速率函数,整理一组常用实战写法。
张卿
2023-05-16
715
14
0
PromQL 是使用 Prometheus 的核心能力,只有理解即时向量、范围向量、标签过滤和时间偏移等基础语法,后续告警与可视化配置才有抓手。本文通过一组常用查询示例带你快速入门。
张卿
2023-05-15
637
20
0
当监控目标不在 Kubernetes 内部、无法用 ServiceMonitor 自动发现,或者需要做域名与 URL 可用性探测时,Prometheus 静态配置就很有价值。本文结合 Blackbox Exporter 演示 Secret、additionalScrapeConfigs 与验证流程的完整配置。
张卿
2023-05-14
646
23
0
黑盒监控与白盒监控关注的是两个完全不同的观察视角:一个强调外部可用性,一个强调内部运行状态。理解两者的差异和适用场景,有助于在 Prometheus 体系中选对采集方式。
张卿
2023-05-13
906
13
0
当 ServiceMonitor 已经创建,但 Prometheus Targets 页面仍然没有出现目标时,问题通常出在标签匹配、Service 暴露、配置生成或 Metrics 访问链路上。本文以 KubeControllerManagerDown 告警为例,演示一套可复用的排查思路。
张卿
2023-05-12
503
30
0
MySQL 属于典型的非云原生应用,接入 Prometheus 监控通常需要先准备业务实例,再部署 mysql-exporter 并通过 ServiceMonitor 暴露指标。本文按照实战顺序梳理部署、采集、验证全过程。
张卿
2023-05-11
556
17
0
对于运行在 Kubernetes 集群外的 Windows 主机,无法直接依赖 ServiceMonitor 自动发现,这时更适合通过 Exporter 配合 Prometheus 静态配置完成接入。本文演示从安装 windows-exporter 到 Prometheus、Grafana 验证的完整过程。
张卿
2023-05-10
654
22
0
监控 Etcd 的难点不在于是否有 metrics 接口,而在于如何把证书、Service、ServiceMonitor 和 Prometheus 配置串起来。本文按照实际接入顺序演示完整流程,并给出 Prometheus 与 Grafana 的验证方式。
张卿
2023-05-09
835
24
0
能否正确编写 ServiceMonitor,直接决定 Prometheus 能否发现 Service 并抓取到正确的指标。本文结合一个 Elasticsearch Exporter 示例,逐项解析常见字段的含义与使用方式。