详情页标题前

阿里云日志服务SLS投递-对接数据仓库-云淘科技

详情页1

日志服务日志投递(LogShipper)功能可以便捷地将日志数据投递到OSS、Table Store、MaxCompute等存储类服务,配合E-MapReduce(Spark、Hive)、MaxCompute进行离线计算

数据仓库(离线计算)

数据仓库(离线计算)是实时计算的补充,两者针对目标不同:

模式 优势 劣势 使用领域
实时计算 快速 计算较为简单 增量为主,监控、实时分析
数据仓库(离线计算) 精准、计算能力强 较慢 全量为主,BI、数据统计、比较

目前对于数据分析类需求,同一份数据会同时做实时计算+数据仓库(离线计算)。例如对访问日志:

  • 通过流计算实时显示大盘数据,例如包括当前PV、UV、各运营商信息。
  • 每天晚上对全量数据进行细节分析,例如分析增长量、同比、环比和Top数据等。

互联网领域有两种经典的模式讨论:

  • Lamdba Architecture:数据进来后,既支持流式处理、同时存入数仓。但用户发起查询时,会根据查询需求和复杂度从实时计算、离线计算拿结果返回。
  • Kappa Architecture:kafka based Architecture。弱化离线计算部分,数据存储都在Kafka中,实时计算解决所有问题。

日志服务提供模式比较偏向Lamdba Architecture。

LogHub/LogShipper一站式解决实时+离线场景

在创建Logstore后,可以在控制台配置日志投递(LogShipper)支持数据仓库对接。当前支持如下:

  • OSS(大规模对象存储):
  • TableStore(NoSQL数据存储服务):由表格存储提供服务,从日志服务拉取数据。更多信息,请参见日志数据传送。
  • MaxCompute(大数据计算服务):

阿里云日志服务SLS投递-对接数据仓库-云淘科技

LogShipper提供如下功能:

  • 准实时:分钟级进入数据仓库
  • 数据量大:无需担心并发量
  • 自动重试:遇到故障自动重试、也可以通过API手动重试
  • 任务API:通过API可以获得时间段日志投递状态
  • 自动压缩:支持数据压缩、节省存储带宽

典型场景 1:日志审计

小A维护了一个论坛,需要对论坛所有访问日志进行审计和离线分析。

  • G部门需要小A配合记录最近180天内用户访问情况,在有需求时,提供某个时间段的访问日志。
  • 运营同学在每个季度需要对日志出一份访问报表。

小A使用日志服务收集服务器上日志数据,并且打开了日志投递(LogShipper)功能,日志服务就会自动完成日志收集、投递、以及压缩。有审查需要时,可以将该时间段日志授权给第三方。需要离线分析时,利用E-MapReduce运行一个30分钟离线任务,即可用最少的成本完成这两件事情。也可以使用阿里云DLA对投递到OSS中的日志数据进行数据分析。

典型场景 2:日志实时+离线分析

小B是一个开源软件爱好者,喜欢利用Spark进行数据分析。需求如下:

  • 移动端通过API收集日志。
  • 通过Spark Streaming对日志进行实时分析,统计线上用户访问。
  • 通过Hive进行T+1离线分析。
  • 将日志数据开放给下游代理商,进行其他维度分析。

该场景下,通过SLS+OSS+EMR/DLA+RAM组合,可轻松实现这类需求。

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/165847.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云日志服务SLS管理MaxCompute投递任务(新版)-云淘科技

    您可以在数据投递概览页面管理MaxCompute投递任务,包括查看MaxCompute投递任务的基础信息、统计报表,修改配置并重启任务、删除MaxCompute投递任务等操作。 前提条件 已创建MaxCompute投递任务。具体操作,请参见创建MaxCompute投递任务(新版)。 已开启任务运行日志。具体操作,请参见开启任务运行日志。 操作入口 登录日志服…

    阿里云日志服务SLS 2023年12月10日
  • 阿里云对象存储OSSPython数据复制-云淘科技

    数据复制是以异步(近实时)方式将源Bucket中的文件(Object)以及对Object的创建、更新和删除等操作自动复制到目标Bucket。OSS支持跨区域复制(Cross-Region Replication)和同区域复制(Same-Region Replication)。 注意事项 本文以华东1(杭州)外网Endpoint为例。如果您希望通过与OSS同地…

    阿里云对象存储 2023年12月10日
  • 阿里云日志服务SLSCLI概述-云淘科技

    为满足越来越多的自动化日志服务配置需求,日志服务提供命令行工具CLI(Command Line Interface)。 主要功能 日志服务命令行工具CLI的主要功能包括: 支持大部分的日志服务REST接口。例如管理Project、Logstore、机器组、消费组和Logtail配置等。 支持多账号,便于跨地域操作日志。 支持基本查询和拉取日志。 支持Elas…

    阿里云日志服务SLS 2023年12月10日
  • 阿里云日志服务SLS通过C++ SDK使用SQL独享版-云淘科技

    本文介绍通过C++ SDK使用SQL独享版的代码示例。 前提条件 已创建RAM用户并完成授权。具体操作,请参见创建RAM用户并完成授权。 已配置环境变量ALIBABA_CLOUD_ACCESS_KEY_ID和ALIBABA_CLOUD_ACCESS_KEY_SECRET。具体操作,请参见配置环境变量。 重要 阿里云账号的AccessKey拥有所有API的访问…

    阿里云日志服务SLS 2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云日志服务SLS高德地图-云淘科技

    本文介绍高德地图的操作步骤及案例。 简介 以地图作为背景,通过图形颜色、图像标记的方式展示地理数据信息。日志服务内嵌的高德地图包括点图和热力图。您在查询和分析语句中使用特定的函数后,日志服务将以地图形式展示分析结果。 基本构成如下: 地图画布 色块 操作步骤 登录日志服务控制台。 在Project列表区域,单击目标Project。 在日志存储 > 日志…

    阿里云日志服务SLS 2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。