详情页标题前

阿里云日志服务SLS性能指南-云淘科技

详情页1

本文档为您介绍进行数据加工时,会影响加工性能的可能的因素。帮助您解决加工性能问题。

根据加工原理,数据加工任务的总体速度取决于源Shard的数量、用户配置的规则逻辑和规则复杂度。一般可以按照每Shard处理1MB/s(压缩前)流量规划,也就是大约85 GB每天每Shard规划。例如:源Logstore的数据写入速度是每天1 TB,那么需要分裂源Logstore的Shard数量为1024GB/85=12个。关于Shard分裂请参见分裂Shard。

数据加工性能

数据加工速率与加工规则有关,具体体现如下:

  • 写出输出
    • 与事件大小相关。写出事件多(事件进行了分裂),写出事件字段越多,内容越长,写出的数据包计算与网络量消耗越大,则速度越慢。反之越快。
    • 与事件分组相关。写出目标越多,事件标签TAG越多,输出的数据包日志组越多,网络交互越多,则速度越慢。反之越快。
  • 加工逻辑

    加工逻辑越复杂,搜索计算越多,频繁进行外部资源同步,对计算与网络消耗越大,则速度越慢。反之越快。

  • 第三方数据源

    从第三方获取数据源进行富化,数据源的数据量越大,或存在跨域通讯,例如去抓取其他区域OSS的文件,则速度越慢。

源Logstore加工扩展

  • 实时数据加工扩展。

    可以通过增加shard(readwrite状态)数量来实现扩展,shard费用请参见按量付费。

  • 历史数据加工扩展。
    Shard分裂仅对新写入数据有效。如果历史数据量较大且Shard数量较少,可以对源Logstore构建多个数据加工任务,分别配置无重叠的加工时间即可。例如要处理9/1到9/10的历史日志,则按照天将任务切分成9个,分别处理时间段:[9/1, 9/2), [9/2, 9/3) .... [9/9, 9/10]
    说明 加工时间是日志接收时间,具体配置请参见创建数据加工任务。

目标Logstore加工扩展

目标Logstore的Shard数量主要由两方面决定:

  • 数据加工的写入速率。Logstore单个Shard的写入速率上限是5 MB/s,因此可以根据源Logstore的Shard数量,加工的并发数来估算。

    例如源Logstore有20个Shard,那么目标Logstore至少有4个Shard。

  • 目标Logstore是否需要建立索引进行查询统计。如果目标Logstore希望建立索引并且进行统计查询,那么建议基于SQL统计每次查询的覆盖范围,每5000万条日志一个Shard的粒度来规划。

    例如,每天加工并写入10 GB日志,按照每条1 KB算,每天有1千万条日志规模。每次查询和统计希望可以覆盖30天数据量,其总体日志量大约是3亿条,建议将目标Logstore的Shard数量规划为6个。

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/159540.html

(0)
上一篇 2023年12月10日 上午1:45
下一篇 2023年12月10日 上午1:46
详情页2

相关推荐

  • 阿里云大数据开发治理平台 DataWorks流程管控-云淘科技

    DataWorks提供了全链路的数据开发治理能力,为您提供了统一的数据开发治理流程,同时也支持您在DataWorks的默认流程上基于自己的业务需求在关键的流程节点进行流程管控。本文为您介绍DataWorks在数据开发过程中支持的流程管控能力。 背景信息 DataWorks的工作空间分为标准模式和简单模式,不同模式工作空间下任务的开发流程存在一定差异,两种模式…

  • 阿里云大数据开发治理平台 DataWorksHDFS数据源-云淘科技

    HDFS是一个分布式文件系统,为您提供读取和写入HDFS双向通道的功能,本文为您介绍DataWorks的HDFS数据同步的能力支持情况。 支持的版本 目前不支持阿里云文件存储HDFS版。 使用限制 离线读 使用HDFS Reader时,请注意以下事项: 由于连通默认资源组到HDFS的网络链路比较复杂,建议您使用独享数据集成资源组完成数据同步任务。您需要确保您…

  • 阿里云日志服务SLS通知内容常见问题-云淘科技

    本文介绍通知内容相关的常见问题。 如何在通知中引用日志内容? 您可以在内容模板中选择合适的变量(labels、annotations、fire_results或results),用于在告警通知中引用日志内容。具体操作,请参见在告警通知中引用日志内容。 如何在通知中展示触发告警的日志内容? 触发告警的查询分析结果存储在fire_results变量中,因此您可通…

    阿里云日志服务SLS 2023年12月10日
  • 阿里云日志服务SLS使用Java SDK管理Shard-云淘科技

    日志服务使用Shard控制Logstore或MetricStore读写数据的能力,数据必定保存在某一个Shard中。本文通过代码示例介绍如何查询、分裂、合并Shard。 前提条件 已创建RAM用户并完成授权。具体操作,请参见创建RAM用户并完成授权。 已配置环境变量ALIBABA_CLOUD_ACCESS_KEY_ID和ALIBABA_CLOUD_ACCES…

    阿里云日志服务SLS 2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云日志服务SLSPullData-云淘科技

    调用PullData接口获取指定游标(Cursor)位置的日志数据。 接口说明 获取日志时必须指定Shard。 目前仅支持读取Protocol Buffer格式数据。 请求语法中Host由Project名称和日志服务Endpoint构成,您需要在Host中指定Project。 已创建并获取AccessKey。更多信息,请参见访问密钥。 阿里云账号Access…

    阿里云日志服务SLS 2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。