详情页标题前

阿里云日志服务SLSFlume消费-云淘科技

详情页1

日志服务支持通过aliyun-log-flume插件与Flume进行对接,实现日志数据的写入和消费。

背景信息

aliyun-log-flume是一个实现日志服务与Flume对接的插件,与Flume对接后,日志服务可以通过Flume与其它数据系统如HDFS、Kafka等对接。aliyun-log-flume提供Sink和Source实现日志服务与Flume的对接。

  • Sink:Flume读取其他数据源的数据然后写入日志服务。
  • Source:Flume消费日志服务的日志数据然后写入其他系统。

更多信息,请参见aliyun-log-flume。

操作步骤

  1. 下载并安装Flume。更多信息,请参见Flume。
  2. 下载aliyun-log-flume插件,并将插件存放于cd/***/flume/lib目录下。更多信息,请参见aliyun-log-flume-1.3.jar。
  3. 在cd/***/flume/conf目录下,创建配置文件flumejob.conf。
    • Sink配置及示例请参见Sink。
    • Source配置及示例请参见Source。
  4. 启动Flume。

Sink

通过Sink将其他数据源的数据通过Flume写入日志服务。目前支持两种解析格式:

  • SIMPLE:将整个Flume Event作为一个字段写入日志服务。
  • DELIMITED:将整个Flume Event作为被分隔符分隔的数据,根据配置的列名解析成对应的字段写入日志服务。

Sink的配置如下:

参数 必须 说明
type 默认配置为com.aliyun.Loghub.flume.sink.LoghubSink。
endpoint Project的服务入口,例如http://cn-qingdao.log.aliyuncs.com。请根据实际情况替换服务入口。更多信息,请参见服务入口。
project Project名称
logstore Logstore名称。
accessKeyId 阿里云AccessKey ID,用于标识用户。为保证账号安全,建议您使用RAM用户的AccessKey。如何获取AccessKey,请参见访问密钥。
accessKey 阿里云AccessKey Secret,用于验证用户的密钥。为保证账号安全,建议您使用RAM用户的AccessKey。如何获取AccessKey,请参见访问密钥。
batchSize 每批次写入日志服务的数据条数。默认为1000条。
maxBufferSize 缓存队列的大小。默认为1000条。
serializer Event序列化格式。支持的模式如下:

  • DELIMITED:设置解析格式为分隔符模式。
  • SIMPLE:设置解析格式为单行模式。默认为该模式。
  • JSON:设置解析格式为JSON模式。
  • 自定义serializer:设置解析格式为自定义的序列化模式,设置为该模式时需要填写完整列名称。
columns 当serializer为DELIMITED时,必须指定该字段列表,用半角逗号(,)分隔,顺序与实际数据中的字段顺序一致。
separatorChar 当serializer为DELIMITED时,用于指定数据的分隔符,必须为单个字符。默认为英文逗号(,)。
quoteChar 当serializer为DELIMITED时,用于指定引用符。默认为半角双引号(”)。
escapeChar 当serializer为DELIMITED时,用于指定转义字符。默认为半角双引号(”)。
useRecordTime 用于设置是否使用数据中的timestamp字段作为日志时间。默认为false表示使用当前时间。

Sink配置示例请参见GitHub。

Source

通过Source将日志服务的日志数据通过Flume投递到其他的数据源。目前支持两种输出格式。

  • DELIMITED:数据以分隔符日志的形式写入Flume。
  • JSON:数据以JSON日志的形式写入Flume。

Source配置如下:

参数 是否必须 说明
type 默认配置为com.aliyun.Loghub.flume.source.LoghubSource。
endpoint Project的服务入口,例如http://cn-qingdao.log.aliyuncs.com。请根据实际情况替换服务入口。更多信息,请参见服务入口。
project Project名称。
logstore Logstore名称。
accessKeyId 阿里云AccessKey ID,用于标识用户。为保证账号安全,建议您使用RAM用户的AccessKey。如何获取AccessKey,请参见访问密钥。
accessKey 阿里云AccessKey Secret,用于验证用户的密钥。为保证账号安全,建议您使用RAM用户的AccessKey。如何获取AccessKey,请参见访问密钥。
heartbeatIntervalMs 客户端和日志服务的心跳间隔,默认为30000毫秒。
fetchIntervalMs 数据拉取间隔,默认为100毫秒。
fetchInOrder 是否按顺序消费。默认为false。
batchSize 每批次读取的数据条数,默认为100条。
consumerGroup 读取的消费组名称。
initialPosition 读取数据的起点位置,支持begin,end,timestamp。默认为begin。 说明 如果服务端已经存在Checkpoint,会优先使用服务端的Checkpoint。
timestamp 当initialPosition为timestamp时,必须指定时间戳,为Unix时间戳格式。
deserializer Event反序列化格式,支持的模式如下:

  • DELIMITED:设置解析格式为分隔符模式。默认为该模式。
  • JSON:设置解析格式为JSON模式。
  • 自定义deserializer:设置解析格式为自定义的反序列化模式,设置为该模式时需要填写完整列名称。
columns 当deserializer为DELIMITED时,必须指定字段列表,用半角逗号(,)分隔,顺序与实际数据中的字段顺序一致。
separatorChar 当deserializer为DELIMITED时,用于指定数据的分隔符,必须为单个字符。默认为英文逗号(,)。
quoteChar 当deserializer为DELIMITED时,用于指定引用符。默认为半角双引号(”)。
escapeChar 当deserializer为DELIMITED时,用于指定转义字符。默认为半角双引号(”)。
appendTimestamp 当deserializer为DELIMITED时,用于设置是否将时间戳作为一个字段自动添加到每行末尾。默认为false。
sourceAsField 当deserializer为JSON时,用于设置是否将日志Source作为一个字段,字段名称为__source__。默认为false。
tagAsField 当deserializer为JSON时,用于设置是否将日志Tag作为字段,字段名称为__tag__:{tag名称}。默认为false。
timeAsField 当deserializer为JSON时,用于设置是否将日志时间作为一个字段,字段名称为__time__。默认为false。
useRecordTime 用于设置是否使用日志的时间,如果为false则使用当前时间。默认为false。

Source配置示例请参见GitHub。

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/161269.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云云原生大数据计算服务 MaxCompute分组取出每组数据的前N条-云淘科技

    本文将为您介绍如何对数据进行分组,取出每组数据的前 N 条数据。 示例数据 目前的数据,如下表所示。 empno ename job sal 7369 SMITH CLERK 800.0 7876 SMITH CLERK 1100.0 7900 JAMES CLERK 950.0 7934 MILLER CLERK 1300.0 7499 ALLEN SAL…

  • 阿里云云原生大数据计算服务 MaxComputeMaxCompute后付费消费突增排查-云淘科技

    在使用MaxCompute开发过程中会产生费用,如果平时每日消费比较平稳,某段时间的费用增长翻倍。在排除业务增长的情况下,可以进行费用分析,排查导致费用突增的项目、作业是哪些,进而及时优化和调整作业,优化成本。本文为您介绍如何结合账单详情和MaxCompute元数据服务(Information Schema)排查MaxCompute后付费消费突增。 背景信息…

  • 阿里云日志服务SLS数据模拟器-云淘科技

    日志服务推出数据模拟器,用于模拟接入各类数据。 内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家阿里云企业补贴进行中: 马上申请腾讯云限时活动1折起,即将结束: 马上收藏同尘科技为腾讯云授权服务中心。 购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

    阿里云日志服务SLS 2023年12月10日
  • 阿里云日志服务SLS服务入口-云淘科技

    本文介绍日志服务不同网络类型的服务入口。 查看服务入口 服务入口(Endpoint)表示日志服务对外服务的访问域名。日志服务提供私网域名和公网域名,不同网络的接入方式请参见使用Logtail收集各网络日志数据。 在Project列表区域,单击目标Project。 在Project的项目概览页面,查看该Project所在地域的服务入口。 如何选择服务入口 私网…

    阿里云日志服务SLS 2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云日志服务SLS数据压缩-云淘科技

    lz4是一种无损压缩算法,具有高速解码与压缩能力。日志服务部分API接口支持lz4压缩算法,使用lz4压缩算法可以减少网络传输流量,降低流量费用,提升接口访问速度。 压缩请求数据 日志服务如下API接口支持在HTTP请求体中传输lz4压缩格式的数据。 PutLogs(PutLogStoreLogs) PutWebtracking 其使用方法主要分为如下几个步…

    阿里云日志服务SLS 2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。