详情页标题前

阿里云日志服务SLS性能指南-云淘科技

详情页1

本文档为您介绍进行数据加工时,会影响加工性能的可能的因素。帮助您解决加工性能问题。

根据加工原理,数据加工任务的总体速度取决于源Shard的数量、用户配置的规则逻辑和规则复杂度。一般可以按照每Shard处理1MB/s(压缩前)流量规划,也就是大约85 GB每天每Shard规划。例如:源Logstore的数据写入速度是每天1 TB,那么需要分裂源Logstore的Shard数量为1024GB/85=12个。关于Shard分裂请参见分裂Shard。

数据加工性能

数据加工速率与加工规则有关,具体体现如下:

  • 写出输出
    • 与事件大小相关。写出事件多(事件进行了分裂),写出事件字段越多,内容越长,写出的数据包计算与网络量消耗越大,则速度越慢。反之越快。
    • 与事件分组相关。写出目标越多,事件标签TAG越多,输出的数据包日志组越多,网络交互越多,则速度越慢。反之越快。
  • 加工逻辑

    加工逻辑越复杂,搜索计算越多,频繁进行外部资源同步,对计算与网络消耗越大,则速度越慢。反之越快。

  • 第三方数据源

    从第三方获取数据源进行富化,数据源的数据量越大,或存在跨域通讯,例如去抓取其他区域OSS的文件,则速度越慢。

源Logstore加工扩展

  • 实时数据加工扩展。

    可以通过增加shard(readwrite状态)数量来实现扩展,shard费用请参见按量付费。

  • 历史数据加工扩展。
    Shard分裂仅对新写入数据有效。如果历史数据量较大且Shard数量较少,可以对源Logstore构建多个数据加工任务,分别配置无重叠的加工时间即可。例如要处理9/1到9/10的历史日志,则按照天将任务切分成9个,分别处理时间段:[9/1, 9/2), [9/2, 9/3) .... [9/9, 9/10]
    说明 加工时间是日志接收时间,具体配置请参见创建数据加工任务。

目标Logstore加工扩展

目标Logstore的Shard数量主要由两方面决定:

  • 数据加工的写入速率。Logstore单个Shard的写入速率上限是5 MB/s,因此可以根据源Logstore的Shard数量,加工的并发数来估算。

    例如源Logstore有20个Shard,那么目标Logstore至少有4个Shard。

  • 目标Logstore是否需要建立索引进行查询统计。如果目标Logstore希望建立索引并且进行统计查询,那么建议基于SQL统计每次查询的覆盖范围,每5000万条日志一个Shard的粒度来规划。

    例如,每天加工并写入10 GB日志,按照每条1 KB算,每天有1千万条日志规模。每次查询和统计希望可以覆盖30天数据量,其总体日志量大约是3亿条,建议将目标Logstore的Shard数量规划为6个。

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/164343.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云大数据开发治理平台 DataWorksMySQL数据源-云淘科技

    MySQL数据源为您提供读取和写入MySQL的双向通道,本文为您介绍DataWorks的MySQL数据同步的能力支持情况。 支持的MySQL版本 离线读写: 支持MySQL 5.5.x、MySQL 5.6.x、MySQL 5.7.x、MySQL 8.0.x,兼容Amazon RDS for MySQL。 离线同步支持读取视图表。 实时读取: 数据集成实时读取…

  • 阿里云日志服务SLS日志采集Agent对比-云淘科技

    日志采集场景下客户端测评 DT时代,数以亿万计的服务器、移动终端、网络设备每天产生海量的日志。中心化的日志处理方案有效地解决了在完整生命周期内对日志的消费需求,而日志从设备采集上云是始于足下的第一步。 三款日志采集工具Logstash开源界ELK stack中的”L”,社区活跃,生态圈提供大量插件支持。Logstash基于JRuby实现,可以跨平台运行在JV…

    2023年12月10日
  • 阿里云RDS数据库使用DTS将自建PostgreSQL迁移至RDS PostgreSQL-云淘科技

    本文介绍如何使用数据传输服务DTS(Data Transmission Service),将自建PostgreSQL迁移至RDS PostgreSQL。DTS支持结构迁移、全量数据迁移和增量数据迁移,同时使用这三种迁移类型可以实现在自建应用不停服的情况下,平滑地完成自建PostgreSQL数据库迁移上云。 前提条件 已创建源数据库自建PostgreSQL和目…

    2023年12月9日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云大数据开发治理平台 DataWorks客户案例-云淘科技

    DataWorks在多个行业中均有典型的案例落地,帮助多个行业的企业解决数据痛点,挖掘数据价值,本文为您介绍典型行业中已落地的客户案例。 新零售行业:大润发云上数据中台建设 客户架构如下。 客户简介 为了快速数字化转型,拥抱新零售,大润发计划两年内将IT系统全面迁移到阿里云上,不再自建IDC。同时与阿里云合作启动数据中台项目,可以帮助大润发降低TCO的同时,…

    2023年12月10日
  • 阿里云RDS数据库AliPG功能模块-云淘科技

    本文介绍AliPG特有的功能模块,包括高权限账号、时空引擎、读写外部数据、并发控制等。 功能模块介绍 类别 功能 描述 账号权限 rds_superuser AliPG提供的rds_superuser是介于普通用户和superuser之间的一种用户,对应的账号称为高权限账号。由于云上环境的安全原因,AliPG不直接提供superuser,但是提供rds_su…

    阿里云数据库 2023年12月9日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。