详情页标题前

阿里云日志服务SLS接入Alertmanager告警-云淘科技

详情页1

Alertmanager是开源监控系统Prometheus中用于处理告警信息的服务,通过将日志服务开放告警配置为Alertmanager中的一个Receiver,可以将Alertmanager产生的告警消息发送到日志服务。

前提条件

已创建协议为Alertmanager的开放告警应用。具体操作,请参见配置开放告警对外接口。

Alertmanager配置

在Alertmanager配置文件的route配置项下添加一个receiver配置,然后在receivers配置项下配置通知渠道。配置内容模板如下:

route:
  receiver: '{RECIEVER_NAME}'
  ...
  
...

receivers:
- name: '{RECIEVER_NAME}'
  webhook_configs:
  - url: 'http://{ALIYUN_SLS_ENDPOINT}/event/webhook/RAMAK_{ACCESS_KEY_ID}/{WEBHOOK_APP_ID}'
  
- name: ...
参数 说明
receiver 自定义的receiver名称。
name 自定义的receiver名称,需与receiver参数中配置的receiver名称相同。
url 告警消息的接收端,此处配置为您在日志服务中创建开放告警服务和应用后生成的接口信息(完整URL)。如何获取,请参见获取接口信息。


说明 如果您的Alertmanager运行在阿里云ECS上,则建议您在选择Alertmanager告警消息接入地域时,选择ECS所在地域,并使用局域网或VPC域名。否则您选择任一地域的公网接口即可。

Alertmanager告警消息解析

Alertmanager告警消息内容示例如下:


说明 如果alerts字段中包含多条告警消息(一组{}代表一条告警消息),则将映射为多条日志服务告警消息。

{
  "version": "4",
  "groupKey": "alertname,job",
  "truncatedAlerts": 0,
  "status": "firing",
  "receiver": "webhook",
  "groupLabels": {
    "alertname": "Alert",
    "job": "promethueus"
  },
  "commonLabels": {
    "instance": "localhost:9090"
  },
  "commonAnnotations": {},
  "externalURL": "http://example.com/#/alerts",
  "alerts": [
    {
      "annotations": {
        "description": "description info",
        "summary": "High request latency"
      },
      "endsAt": "2020-10-28T12:28:52.710Z",
      "startsAt": "2020-10-28T12:23:37.710Z",
      "generatorURL": "",
      "labels": {
        "alertname": "Alert",
        "instance": "localhost:9090",
        "job": "prometheus",
        "severity": "page"
      }
    },
    ...
  ]
}

字段映射

Alertmanager告警消息被接入到日志服务后,映射为日志服务告警内容。示例如下:

{
  "aliuid": "{开放告警应用所属的阿里云账号ID}",
  "alert_instance_id": "{自动生成}",
  "project": "{告警中心所属的Project}",
  "region": "{告警中心Project所在地域}",
  "alert_id": "Alert",
  "alert_type": "sls_pub",
  "alert_name": "Alert",
  "next_eval_interval": 0,
  "alert_time": 1603859020,
  "fire_time": 1603859017,
  "resolve_time": 0,
  "status": "firing",
  "labels": {
    "instance": "localhost:9090",
    "job": "prometheus"
  },
  "annotations": {
    "__pub_alert_region__": "{接收告警消息的网络接口对应的地域}",
    "__config_app__": "sls_pub_alert",
    "__pub_alert_service__": "{开放告警服务ID}",
    "__pub_alert_app__": "{开放告警应用ID}",
    "__pub_alert_protocol__": "alert_manager",
    "desc": "description info",
    "summary": "High request latency"
  },
  "severity": 2,
  "policy": {
    "alert_policy_id": "{开放告警应用中配置的告警策略}",
    "action_policy_id": "{开放告警应用中配置的行动策略}",
    "repeat_interval": "{开放告警应用中配置的重复等待时间}"
  },
...

日志服务告警内容与Alertmanager告警内容的映射关系如下:

日志服务 Alertmanager 说明
aliuid 用于接入告警的开放告警应用所属的阿里云账号ID。
alert_id alertname 告警监控规则ID。

如果Alertmanager告警消息的labels字段中有alertname字段,则alert_id的值为alertname字段的值,否则为空。

alert_type 告警类型,固定为sls_pub。
alert_name alertname 告警监控规则名称。

如果Alertmanager告警消息的labels字段中有alertname字段,则alert_name的值为alertname字段的值,否则为空。

status status 告警状态。
next_eval_interval 告警评估时间间隔,固定为0。
alert_time 告警触发时间,为日志服务接收到Alertmanager告警消息的时间。
fire_time startsAt 告警首次触发时间。
resolve_time endsAt 告警恢复时间。

如果Alertmanager告警消息中的status为firing,则resolve_time的值为0,否则为endsAt对应的时间戳。

labels labels 告警标签信息。

如果您在创建开放告警应用时 ,在信息加工中添加了标签信息,则此标签信息将被添加到labels字段中。

annotations annotations 告警标注信息。日志服务告警的annotations字段中将添加如下额外字段。

  • __config_app__: “sls_pub_alert”
  • __pub_alert_service__: {开放告警服务ID}
  • __pub_alert_app__: {开放告警应用ID}
  • __pub_alert_protocol__: “alert manager”
  • __pub_alert_region__: {接收告警消息的网络接口对应的地域}
  • desc:

    如果Alertmanager告警消息的annotations字段中含有desc字段、description字段和summary字段,则desc字段的值为上述三个字段值合并后的值。

如果您在创建开放告警应用时 ,在信息加工中添加了标注信息,则此标注信息将被添加到annotations字段中。

severity severity 告警严重度。


说明 如果Alertmanager告警消息中存在severity字段,则将Alertmanager告警消息发送到日志服务后,日志服务会根据该字段映射告警严重度。如果没有,则默认映射为中等。更多信息,请参见告警严重程度。

policy 您在开放告警应用中配置的告警策略。更多信息,请参见Policy结构。
project 告警中心所属的Project。更多信息,请参见项目(Project)。
drill_down_query
  • generatorURL
  • externalURL、groupLabels
Alertmanager告警消息的URL。

  • 如果Alertmanager告警消息中有generatorURL字段,则drill_down_query字段的值为generatorURL字段的值。
  • 如果Alertmanager告警消息中没有generatorURL字段且groupLabels字段值为空,则drill_down_query字段的值为externalURL字段的值。
  • 如果Alertmanager告警消息中没有generatorURL字段且groupLabels字段值不为空,则drill_down_query字段的值为externalURL字段值和groupLabels字段值合并后的值。

单击该URL,系统将跳转至Alertmanager的Alert管理界面,并自动为您过滤显示符合groupLabels字段内容的告警消息。

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:http://www.yunxiaoer.com/161131.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云日志服务SLS获取Logstore数据(维表)错误-云淘科技

    如果加工规则中涉及其他Logstore资源的加载,则有可能会产生资源的加载或刷新错误。本文档主要介绍从其他Logstore获取数据的常见错误以及排查处理方法。 在成功读取源Logstore数据后,加工引擎开始对源Logstore的日志事件进行加工。如果加工规则中涉及OSS、RDS、Logstore等外联资源的加载,则也有可能会产生资源的加载或刷新错误。 错误…

    阿里云日志服务SLS 2023年12月10日
  • 阿里云日志服务SLS添加过滤器类型的过滤器-云淘科技

    将Nginx访问日志采集到日志服务后,您可以通过查询与分析语句查看每分钟的访问PV。如果您想要查看不同请求方法的访问PV,则可以添加过滤器类型的过滤器,通过动态列表项快速查看。本文以Nginx访问日志为例说明如何添加过滤器类型的过滤器,从而查看不同请求方法的访问PV。 前提条件 已采集Nginx访问日志。具体操作,请参见使用Nginx配置模式采集日志。 已配…

    2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云日志服务SLS常见问题-云淘科技

    本文介绍定时SQL功能的常见问题。 如何保证SQL分析的数据准确性? 数据延迟写入或实例的调度配置不恰当时,可能发生数据分析不准确问题。 数据写入存在延迟。例如数据写入日志服务延迟了5分钟,实例执行时间为12:03:00,SQL时间窗口为相对一分钟,即[12:02:00,12:03:00),则查询不到最新的数据。 数据写入日志服务到能够被查询到,这期间存在延…

    阿里云日志服务SLS 2023年12月10日
  • 阿里云日志服务SLS使用RAM用户创建告警-云淘科技

    本视频介绍为阿里云RAM用户授予告警操作权限和使用RAM用户创建告警的基本步骤。 内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家阿里云企业补贴进行中: 马上申请腾讯云限时活动1折起,即将结束: 马上收藏同尘科技为腾讯云授权服务中心。 购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

    阿里云日志服务SLS 2023年12月10日
  • 阿里云日志服务SLS从OSS获取IPIP库进行IP地址数据富化-云淘科技

    日志服务数据加工功能支持从OSS获取IPIP库数据,对日志中的IP地址进行富化,补充IP地址所属的国家、省、市等信息。 前提条件 已创建访问密钥(AccessKey),用于访问OSS Bucket。具体操作,请参见创建AccessKey。 推荐创建一个只读权限的AccessKey,用于从OSS获取文件;一个只写权限的AccessKey,用于上传文件到OSS。…

    2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。