运维监控系列(13)-Alertmanager安装及添加Prometheus监控

下载安装

Github下载地址
 
可以看到几乎支持所有的服务器系统,这里直接选择一个自己系统的包下载,然后解压,目录很简单,包含alertmanager主程序、配置文件、工具主程序。
 

首先再来看下alertmanager.yml默认配置,混个眼熟,不必完全理解。

# 全局配置
global:
  # 告警超时时间
  resolve_timeout: 5m
# 路由配置
route:
  # 用于将传入警报分组在一起的标签。
  group_by: ['alertname']
  # 发送通知的初始等待时间
  group_wait: 30s
  # 在发送有关新警报的通知之前需要等待多长时间 
  group_interval: 5m
  # 如果已发送通知,则在再次发送通知之前要等待多长时间,通常约3小时或更长时间
  repeat_interval: 1h
  # 接受者名称
  receiver: 'web.hook'
# 接受者
receivers:
# 接受者名称
- name: 'web.hook'
  # webhook URL
  webhook_configs:
  - url: 'http://127.0.0.1:5001/'
# 抑制规则
inhibit_rules:
  - source_match:
      # 原标签匹配=》告警级别:严重
      severity: 'critical'
    target_match:
      # 目标标签匹配=》告警级别:警告
      severity: 'warning'
    # 警报中必须有以下标签值才会被抑制。
    equal: ['alertname', 'dev', 'instance']

这里直接双击alertmanager.exe,启动告警器:
 
可以看到,访问端口为9093,直接访问,可以看到也有一个和promethues差不多的控制台。
 

访问metrics接口http://localhost:9093/metrics,也有监控信息返回,说明也可以直接接入promethues监控中。
 

Prometheus+Grafana监控Alertmanager告警器

1. 配置Prometheus

Alertmanager启动以后,在Prometheus添加监控Alertmanager的Job,然后重新启动。

# 监控资源配置
scrape_configs:
   # Alertmanager 监控
  - job_name: 'alters'
    static_configs:
    - targets: ['localhost:9093'] 

 

2. 配置Grafana

直接输入ID 9578,这里没有完善使用alertmanager,所以很多没数据
 

版权声明:本文不是「本站」原创文章,版权归原作者所有 | 原文地址: