日志服务定时SQL已内置监控规则模板,您只需添加对应的告警实例即可实时监控定时SQL任务,并可通过钉钉等渠道接收到告警通知。本文介绍设置告警的相关操作。
前提条件
已创建定时SQL任务。
- 如果是将源Logstore中的数据通过定时SQL处理后存储到目标Logstore,请参见从Logstore到Logstore。
- 如果是将源Logstore中的数据通过定时SQL处理后存储到目标MetricStore中,请参见从Logstore到MetricStore。
- 如果是将源MetricStore中的数据通过定时SQL处理后存储到目标MetricStore中,请参见从MetricStore到MetricStore。
步骤一:开启任务运行日志
- 登录日志服务控制台。
- 在Project列表区域,单击目标Project。该Project为定时SQL任务所在的Project。
- 在页面左上方,单击
图标。
- 进入开通任务运行日志页面。
- 如果您开未通过该Project的详细日志,则在服务日志页签中,单击开通服务日志。
- 如果您已开通过该Project的详细日志,则在服务日志页签中,单击
图标。
- 设置如下参数,然后单击确定。
参数 说明 任务运行日志 打开任务运行日志开关后,系统将在您指定的Project中自动创建一个名为internal-diagnostic_log的Logstore,用于存储定时SQL、MaxCompute投递、OSS投递、数据导入等任务的运行日志与错误日志。日志字段说明,请参见定时SQL任务运行日志。 日志存储位置 开通任务运行日志功能后,需要选择日志的存储位置,即需要指定Project。可以设置为: - 自动创建(推荐)。
- 当前Project。
- 同一地域下的其他Project。
开通任务运行日志后,如果定时SQL任务执行失败,您可以在指定Project下的internal-diagnostic_log Logstore中查看定时SQL任务的错误日志。其中定时SQL任务的错误日志的日志主题(__topic__)为scheduled_sql_alert。
步骤二:配置行动策略
- 登录日志服务控制台。
- 进入行动策略管理页面。
- 在Project列表区域,单击任意的Project。
- 在左侧导航栏中,单击告警。
- 选择告警管理 > 行动策略。
- 找到目标行动策略(sls.app.scheduled_sql.builtin),单击修改。您也可以创建新的行动策略用于告警通知。具体操作,请参见创建行动策略。
- 在编辑行动策略页面中,将请求地址修改为钉钉群机器人的Webhook地址。其他选项,保持默认配置。如何获取钉钉群机器人的WebHook地址,请参见钉钉-自定义。您也可以根据业务需求,使用其他告警渠道。具体操作,请参见通知渠道说明。
- 单击确认。
步骤三:添加告警实例
日志服务已内置如下两种监控规则模板,您只需根据业务需求,添加对应的告警实例即可。两种告警实例的配置参数类似,此处以添加定时SQL任务执行延迟监控规则对应的告警实例为例。
- 定时SQL任务执行错误监控:每5分钟检测一次,当定时SQL任务出现错误后,触发告警。
- 定时SQL任务执行延迟监控:每5分钟检测一次,当定时SQL任务的延迟时间超过指定阈值后,触发告警。
- 登录日志服务控制台。
- 在Project列表区域,单击目标Project。该Project为您internal-diagnostic_log Logstore所在的Project。
- 在左侧导航栏中,单击告警。
- 在规则/事务页签中,单击SLS定时SQL(2)。
- 在规则列表中,单击定时SQL任务执行延迟监控对应的添加。
- 在参数设置对话框中,配置监控规则,然后单击设置并开启。
参数 说明 告警名称 告警名称,支持自定义。 延迟阈值 定时SQL任务执行的延迟时间超过该阈值后,触发告警。默认值为10分钟。 监控的Project 需监控的Project名称。 - 默认值为
.*
,表示监控您当前阿里云账号下的所有Project。 - 多个Project之间可以使用竖线(|)分隔。您还可以使用正则表达式
.*
进行配置,例如sche.*,表示监控以sche开头的Project。
监控的任务名称 需监控的定时SQL任务名称。 - 默认值为
.*
,表示监控您所指定的Project下的所有定时SQL任务。 - 多个定时SQL任务之间可以使用竖线(|)分隔。您还可以使用正则表达式
.*
进行配置,例如sche.*,表示监控以sche开头的定时SQL任务。
行动策略 当前告警所绑定的行动策略,日志服务将通过该行动策略给指定用户发送告警通知。 默认为
sls.app.scheduled_sql.builtin
(SLS 定时SQL内置行动策略)。您也可以自定义行动策略。具体操作,请参见创建行动策略。严重度 定义告警消息的严重度。 添加完成后,您可以在监控规则列表中,单击定时SQL任务执行延迟监控规则对应的+,查看已开启的告警实例。
- 默认值为
内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家
阿里云企业补贴进行中: 马上申请
腾讯云限时活动1折起,即将结束: 马上收藏
同尘科技为腾讯云授权服务中心。
购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠
转转请注明出处:https://www.yunxiaoer.com/164001.html