日志服务支持您为查询和分析结果设置告警监控规则,并在满足条件时触发告警。本文以网站访问日志为例,说明如何快速为日志设置告警。
前提条件
已在数据实验室中生成模拟的网站访问日志。具体操作,请参见使用数据实验室。
背景信息
日志服务数据实验室提供模拟的网站访问日志及相关仪表盘(网站审计中心、网站访问中心等),便于您熟悉查询、分析、告警等操作。本案例以监控网站审计中心仪表盘中的统计图表请求成功率和响应时间趋势为例,当请求成功率低于90%、响应时间高于60s时,触发告警,并通过短信方式通知给SLS运维组。
步骤一:创建用户和用户组
用户和用户组用于指定告警通知对象。例如创建用户(Alice和Kumar)、用户组(SLS运维组),并将Alice和Kumar加入到SLS运维组中。
-
登录日志服务控制台。
-
进入用户管理页面。
-
在Project列表区域,单击任意一个Project。
-
在左侧导航栏中,单击告警。
-
在告警中心页面,选择通知对象 > 用户管理。
-
-
创建用户。
-
单击创建。
-
在添加用户对话框中,输入用户信息,单击确认。
必要参数说明和配置示例如下所示。
参数
描述
示例
标识符
用户唯一标识,不可重复。
10001、10002
姓名
用户姓名。
Kumar、Alice
手机号
用户手机号码。
86-1381111*****、86-1381112*****
可收短信
打开可收短信开关,表示允许日志服务给该手机号码发送短信通知。
打开可收短信开关
可接电话
打开可接电话开关,表示允许日志服务给该手机号码发送语音通知。
打开可接电话开关
启用
打开启用开关,表示允许日志服务给该用户发送告警通知。
打开启用开关
-
-
创建用户组。
-
在告警中心页面,选择通知对象 > 用户组管理。
-
在用户组管理页签中,单击创建。
-
在添加用户组对话框中,配置如下参数,单击确认。
必要参数说明和配置示例如下所示。
参数
描述
示例
标识符
用户组唯一标识,不可重复。
group-01
组名
用户组名称。
SLS运维组
待添加成员
您已创建的用户。
Kumar、Alice
已添加成员
已添加到用户组的用户。
Kumar、Alice
启用
打开启用开关,表示允许日志服务给该用户组发送告警通知。
打开启用开关
-
步骤二:创建日志告警监控规则
告警监控规则用于监控日志查询和分析结果。例如监控统计图表请求成功率和响应时间趋势,当请求成功率低于90%,响应时间高于60s时,触发告警。
-
在告警中心页面,单击告警规则。
-
单击新建告警。
-
在告警监控规则面板中,配置如下参数,然后单击确定。
必要参数说明和配置示例如下所示:
参数
描述
示例
规则名称
配置告警监控规则名称。
网站日志告警监控规则
检查频率
根据您配置的频率对查询和分析结果进行检查。
-
每小时:每小时检查一次查询和分析结果。
-
每天:在每天的某个固定时间点检查一次查询和分析结果。
-
每周:在周几的某个固定时间点检查一次查询和分析结果。
-
固定间隔:按照固定间隔检查查询和分析结果。
-
Cron:通过Cron表达式指定时间间隔,按照该指定的时间间隔检查查询和分析结果。
Cron表达式的最小精度为分钟,24小时制,例如0 0/1 * * *表示从00:00开始,每隔1小时检查一次。
每天,00:00
查询统计
单击输入框,在查询统计对话框中,设置查询和分析语句。关于查询分析的使用限制,请参见查询和分析。
-
关联报表:您可以选择监控仪表盘。
-
高级配置:在高级配置页签下,您可以选择监控日志库、指标库和资源数据。
-
日志库:用于存储日志,相关的查询分析配置请参见查询和分析日志。
-
指标库:用于存储时序数据,相关的查询分析配置请参见查询和分析时序数据。
-
资源数据:用于配置特定告警监控规则所关联的外部数据。更多信息,请参见创建资源数据。
-
配置多个查询统计时,您可以指定集合操作关联多个查询结果。更多信息,请参见多集合操作机制。
-
0:选择网站审计中心仪表盘中的请求成功率图表。
-
1:选择网站审计中心仪表盘中的响应时间趋势图表。
-
集合操作配置为笛卡尔积。
分组评估
日志服务支持对查询和分析结果进行分组。
-
标签自定义:日志服务根据您配置的字段对查询和分析结果进行分组。分组后,每个组单独评估触发条件。在每个检查周期内,查询和分析结果满足触发条件时,各个分组各自产生一条告警。
支持设置配置多个字段。
-
不分组:在每个检查周期内,满足触发条件时,只产生一条告警。
-
标签自动:当您在查询统计中选择指标库(即监控时序数据的查询和分析结果)时 ,日志服务支持标签自动分组。
分组后,每个组单独评估触发条件。在每个检查周期内,查询和分析结果满足触发条件时,各个分组各自产生一条告警。
不分组
触发条件
配置触发条件及严重度。
-
触发条件
-
有数据:当查询和分析结果中存在数据时,触发告警。
-
有特定条数据:当查询和分析结果中存在N条数据时,触发告警。
-
有数据匹配:当查询和分析结果中存在数据满足告警表达式时,触发告警。
-
有特定条数据匹配:当查询和分析结果中存在N条数据满足告警表达式时,触发告警。
-
-
严重度
主要用于告警降噪控制和告警通知控制,即您在创建告警策略或行动策略时,可添加关于告警严重度的判断条件。更多信息,请参见设置告警严重度。
-
简单配置:直接选择告警严重度,则表示通过该规则产生的告警都为同一严重度。
-
分条件配置:单击添加,分条件设置告警严重度。
-
告警条件表达式的相关语法,请参见告警条件表达式语法。
-
有数据匹配
-
$0.success_ratio 60
-
严重度:中
说明
当字段中存在括号()时,需使用反斜线(\)进行转义。
添加标注
日志服务允许您给产生的告警添加非标识性属性,键值对格式。主要用于告警降噪控制和告警通知控制,即您在创建告警策略或行动策略时,可添加关于标注的判断条件。更多信息,请参见标签和标注。
您还可以打开自动添加标注开关,系统自动在告警中添加__count__等信息。更多信息,请参见自动标注。
-
标题(title):监控网站请求成功率和平均响应时间
-
描述(desc):请求成功率:${success_ratio},平均响应时间:${平均响应时间(s)}
-
自动添加标注:打开
连续触发阈值
配置连续触发阈值。当累计的触发次数达到该值时,产生一条告警。不满足触发条件时不计入统计。
1
告警策略
告警策略用于合并、静默和抑制已产生的告警。
-
选择极简模式和普通模式时,您无需配置告警策略。日志服务默认使用SLS内置动态告警策略(sls.builtin.dynamic)进行告警管理。
-
选择高级模式时,您可以选择内置的或自定义的告警策略进行告警管理。如何创建告警策略,请参见创建告警策略。
极简模式
行动策略
行动策略用于控制告警通知渠道和频率等。
-
当告警策略选择为极简模式时,您只需配置行动组即可。
您配置行动组后,日志服务自动为您创建一个名为
规则名称-行动策略
的行动策略。由该告警监控规则触发的所有告警都通过该行动策略发送通知。如何配置,请参见通知渠道说明。重要
您可以在行动策略管理页面,修改该行动策略。具体操作,请参见创建行动策略。如果您在修改行动策略时添加了判断条件,则此处的告警策略将自动变更为普通模式。
-
当告警策略选择为普通模式或高级模式时,您可以选择内置的或自定义的行动策略进行告警通知。如何创建行动策略,请参见创建行动策略。
其中,您选择告警策略选择为高级模式时,还可以开启或关闭自定义行动策略。更多信息,请参见动态行动策略机制。
-
渠道:短信
-
接收人:SLS运维组
-
内容模板:SLS内置内容模板
-
发送时段:任意
重复等待
在重复等待时间内,重复的告警只触发一次行动策略,即只发送一次告警通知。
5分钟
-
步骤三:查看告警触发记录
创建告警监控规则后,日志服务会根据您创建的规则监控查询和分析结果。当查询和分析结果满足触发条件时,触发告警。您可以在告警规则中心仪表盘中查看告警触发的记录。
-
在告警中心页面,选择告警大盘 > 告警规则中心。
-
在告警规则评估状态图表中,查看已执行的告警监控规则。
内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家
阿里云企业补贴进行中: 马上申请
腾讯云限时活动1折起,即将结束: 马上收藏
同尘科技为腾讯云授权服务中心。
购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠
转转请注明出处:https://www.yunxiaoer.com/159568.html