详情页标题前

阿里云日志服务SLS加工历史数据-云淘科技

详情页1

日志服务支持加工历史数据,本文介绍加工历史数据的操作步骤及相关问题。

前提条件

  • 已采集数据到日志服务。具体操作,请参见数据采集。
  • 如果您使用的是RAM用户,则需要先授予RAM用户数据加工操作权限。具体操作,请参见授予RAM用户数据加工操作权限。

创建数据加工任务

  1. 登录日志服务控制台。
  2. 进入数据加工页面。
    1. 在Project列表区域,单击目标Project。
    2. 在日志存储 > 日志库页签中,单击目标Logstore
    3. 查询和分析页面,单击数据加工。
  3. 在页面右上角,选择数据的时间范围。选择时间范围后,请确认原始日志页签中存在日志。
  4. 在编辑框中,输入数据加工语句。加工语句的语法请参见数据加工语法。
  5. 预览数据。
    1. 单击快速。日志服务支持快速预览和高级预览。更多信息,请参见预览调试概述。
    2. 单击预览数据。

      查看预览结果。

      • 如果加工语句错误或者权限配置错误,导致数据加工失败,请根据页面提示处理。
      • 如果确认数据加工结果无误,请执行步骤6。
  6. 创建数据加工任务。具体操作,请参见创建数据加工任务。其中,您需要根据您要加工的数据时间,设置加工范围。阿里云日志服务SLS加工历史数据-云淘科技
    选项 说明
    所有 从Logstore接收到第一条数据的时间点开始数据加工任务,直到加工任务被手动停止。
    某时间开始 指定数据加工任务的开始时间,从该时间点开始加工,直到加工任务被手动停止。
    特定时间范围 指定数据加工任务的起止时间,从指定的开始时间点开始加工,到指定的结束时间后加工任务自动停止。

查看加工结果

您可以在目标Logstore中查看对应的加工结果数据。如果目标Logstore无数据,您可以参考以下方案进行解决。

扩大数据查询时间范围

如果您在数据加工语句中未对__time__字段进行设置,那么某条数据在目标Logstore的时间和在源Logstore中的时间是一致的,而打开目标Logstore查询数据时,默认的查询时间范围为最近15分钟,您可能查询不到历史数据的加工结果。此时,您可以扩大查询的时间范围。

例如历史数据的时间为2023-04-11 10:00:00,加工时间为2023-04-12 09:00:00,写入目标Logstore后,数据的时间仍为2023-04-11 10:00:00,因此您在2023-04-12 09:01:00打开目标Logstore时,默认的查询时间为15分(相对),将查询不到该条数据,您可以将查询时间范围修改为1天(相对),再进行查询。阿里云日志服务SLS加工历史数据-云淘科技

创建索引

如果您打开目标Logstore时,提示如下错误,表示您未创建索引。索引是一种倒排的数据存储结构,由关键词和指向实际数据的逻辑指针组成,用于快速根据关键词定位到具体数据行,类似于数据的目录。您只有创建索引后,才能看到加工结果数据。具体操作,请参见创建索引。阿里云日志服务SLS加工历史数据-云淘科技

重建索引

创建索引只对新写入目标Logstore的数据生效。如果您是在创建数据加工任务后才在目标Logstore中创建索引,那么默认情况下,您无法查询在创建索引前已通过数据加工写入的数据。此时,您可以对已写入目标Logstore的数据重建索引。具体操作,请参见重建索引。

提高历史数据加工效率

当您的历史数据量较大,且同时需要对它们进行加工时,由于受限于单个数据加工任务的处理效率,往往很难满足实时性需求,可能会出现加工消费延迟大且不降低的现象。此时,您可以为历史数据创建一个或多个数据加工任务,另外对实时写入的数据,创建一个单独的加工任务。

例如您在2023-01-16要创建一个数据加工任务,加工从2023-01-01 00:00:00开始写入源Logstore的所有数据,则您可以将2023-01-01 00:00:00~2023-01-15 23:59:59期间的历史数据分成三份,并分别创建一个加工任务,然后为2023-01-16 00:00:00后实时写入的数据也创建一个加工任务,如下图所示。阿里云日志服务SLS加工历史数据-云淘科技

任务一

创建加工任务一,加工2023-01-01 00:00:00~2023-01-05 23:59:59期间的历史数据。

阿里云日志服务SLS加工历史数据-云淘科技

任务二

创建加工任务二,加工2023-01-06 00:00:00~2023-01-10 23:59:59期间的历史数据。

阿里云日志服务SLS加工历史数据-云淘科技

任务三

创建加工任务三,加工2023-01-11 00:00:00~2023-01-15 23:59:59期间的历史数据。

阿里云日志服务SLS加工历史数据-云淘科技

任务四

创建加工任务四,加工2023-01-16 00:00:00后实时写入的数据。

阿里云日志服务SLS加工历史数据-云淘科技

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/165838.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云大数据开发治理平台 DataWorks开发阶段-云淘科技

    您在完成需求评审、模型与调度设计后,即可进入数据开发阶段。 开发阶段的主要任务是将设计阶段的产出转化为具体代码。开发过程中,开发人员必须保证代码的规范性、准确性。同时进行适当的单元测试,以便后续测试工作可以顺利开展。 开发阶段的流程包括以下步骤: 代码开发 该部分内容请参见编码规范,编码时需要注意以下问题: 层次分明、结构化强。 增加必要注释,以增强代码的可…

    2023年12月10日
  • 阿里云日志服务SLS查询概述-云淘科技

    日志服务支持秒级查询十亿到千亿级别的日志数据。 基本语法 查询语句和分析语句以竖线(|)分割。查询语句的语法为日志服务专有语法,更多信息,请参见查询语法。 重要 查询语句可单独使用,分析语句必须与查询语句一起使用。即分析功能是基于查询结果或全量数据进行的。 如果您需要查询百亿级的日志数据量,您可以反复执行(10次以内)某查询语句获取最终完整的结果。更多信息,…

    阿里云日志服务SLS 2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云日志服务SLS显示模式-云淘科技

    查看仪表盘时,默认为显示模式。在显示模式下,您可以直观、清晰地查看该仪表盘下的所有统计图表。同时日志服务还提供一系列针对仪表盘显示模式的操作。 前提条件 已创建仪表盘。具体操作,请参见创建仪表盘。设置仪表盘的查询时间(全局时间)仪表盘的查询时间,即仪表盘的全局时间,可控制仪表盘中所有统计图表的查询时间范围。设置后,所有统计图表展示的是同一时段的查询和分析结果…

    2023年12月10日
  • 阿里云ECS云服务器NVMe云盘概述-云淘科技

    支持NVMe(Non-Volatile Memory Express)协议的ESSD云盘称为NVMe云盘。NVMe云盘支持同时挂载到多台支持NVMe协议的ECS实例上,以实现数据共享。本文主要介绍NVMe云盘的使用限制以及相关操作。 概述 NVMe云盘支持多ECS实例并发读写访问,具备高可靠、高并发、高性能等特点,为ECS实例提供了多实例挂载和IO拦截功能。…

    2023年12月9日
  • 阿里云人工智能平台PAITableRecordDataset-云淘科技

    您可以使用TableRecordDataset接口按照行读取MaxComepute表数据并构建数据流。 TensorFlow社区推荐在1.2及以上版本,使用Dataset接口代替线程和队列构建数据流。通过多个Dataset接口的组合变换生成计算数据,可以简化数据输入代码。 接口说明 PAI-TF提供的TableRecordDataset与原生TensorFl…

    阿里云人工智能平台PAI 2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。