详情页标题前

阿里云日志服务SLS实时计算(Blink)消费-云淘科技

详情页1

阿里云实时计算通过创建日志服务源表的方式,可以直接消费日志服务中的数据。本文介绍了如何为实时计算创建日志服务源表以及创建过程涉及到的属性字段提取和类型映射。

创建日志服务源表

日志服务是实时数据存储,实时计算能将其作为流式数据输入。假设有如下日志内容:

__source__:  11.85.123.199
__tag__:__receive_time__:  1562125591
__topic__:  test-topic
a:  1234
b:  0
c:  hello

实时计算日志服务源表DDL示例如下:

create table sls_stream(
  a int,
  b int,
  c varchar
) with (
  type ='sls',
  endPoint ='',
  accessId ='',
  accessKey ='',
  startTime = '2017-07-05 00:00:00',
  project ='ali-cloud-streamtest',
  logStore ='stream-test',
  consumerGroup ='consumerGroupTest1'
);

WITH参数说明:

参数 必须 说明
endPoint 日志服务Endpoint,详情请参见服务入口。
accessId 访问日志服务的AccessKey ID。
accessKey 访问日志服务的密钥AccessKey Secret。
project 日志服务Project名称。
logStore 日志服务Logstore名称。
consumerGroup 消费组名称。
startTime 消费日志开始的时间点。
heartBeatIntervalMills 消费客户端的心跳间隔时间,默认为10秒。
maxRetryTimes 读取最大尝试次数,默认5次。
batchGetSize 单次读取logGroup条数,默认为10条。如果Blink的版本是1.4.2版本及以上版本,则默认为100条,最大1000条。


说明 如果单条日志的大小和batchGetSize都很大,可能会导致Java系统频繁的对内存数据进行垃圾回收。

columnErrorDebug 是否打开调试开关,如果打开,会把解析异常的日志打印出来。默认为false。

属性字段提取

除日志字段外,支持提取如下三个属性字段,也支持提取其它自定义字段。

属性字段 说明
__source__ 日志来源。
__topic__ 日志主题。
__timestamp__ 日志时间。

属性字段的提取需要添加HEADER声明,示例如下:

create table sls_stream(
  __timestamp__ bigint HEADER,
  __receive_time__ bigint HEADER
  b int,
  c varchar
) with (
  type ='sls',
  endPoint ='',
  accessId ='',
  accessKey ='',
  startTime = '2017-07-05 00:00:00',
  project ='ali-cloud-streamtest',
  logStore ='stream-test',
  consumerGroup ='consumerGroupTest1'
);

类型映射

日志服务字段类型和实时计算字段类型对应关系如下,建议您使用该对应关系进行DDL声明。

日志服务字段类型 实时计算字段类型
STRING VARCHAR

如果使用其他类型也会尝试自动转换,例如1000或者2018-01-12 12:00:00也可以定义为bigint和timestamp类型。

注意事项

  • Blink 2.2.0版本及之前的版本不支持Shard的扩容和缩容,如果分裂或者缩容了某个正在实时计算读取的Logstore,会导致任务持续出错且不可恢复,这种情况下需要重新启动任务来使任务恢复正常。
  • 所有blink版本均不支持对正在消费的LogStore进行删除重建。
  • Blink 1.6.0版本及之前版本,在Shard数目很多的情况下指定消费组可能会影响读取性能。
  • 日志服务暂不支持Map类型的数据。
  • 不存在的字段默认为null。
  • 字段顺序支持无序,建议您在设置时字段顺序和表中参数顺序一致。
  • 如果一个Shard没有新数据写入,会导致任务的整体延迟增加。在这种情况下,只需要把并发数调整为读写的Shard数量即可。
  • 针对__tag__:__hostname____tag__:__path__等字段,去掉前面的tag,按照获取属性字段的方式获取即可。


    说明 调试时无法抽取到该类型数据,建议您用本地DEBUG方法,上线运行后打印到日志中查看。

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/164927.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云日志服务SLS查看性能分析大盘-云淘科技

    性能分析大盘用于分析您的资源使用和性能情况,便于您掌控业务增长和性能消耗情况。 前提条件 已开启秒级监控数据的采集功能。具体操作,请参见开启数据采集功能。 功能入口 登录日志服务控制台。 在日志应用区域,单击CloudLens for EBS。 在左侧导航栏中,单击性能分析。 数据详情 您可以在性能大盘页面,查看指定时间内云盘的吞吐量、IOPS等指标。 图表…

    阿里云日志服务SLS 2023年12月10日
  • 阿里云日志服务SLS结果字段说明-云淘科技

    智能异常分析的结果数据保存在名为internal-ml-log的Logstore中。本文介绍结果数据中的字段详情。 通用的tag结构说明 各类任务的结果数据中都包含如下通用字段。说明 您可以通过__tag__:__job_name__和__tag__:__schedule_id__字段,查询对应任务的结果数据。 __tag__:__apply_time__:…

    阿里云日志服务SLS 2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云RDS数据库DescribeDBMiniEngineVersions – 查询可使用的内核版本列表-云淘科技

    该接口用于查询可用的MySQL或PostgreSQL小版本列表。 接口说明 适用引擎 RDS MySQL RDS PostgreSQL 功能说明 该接口用于新购、升级RDS MySQL、PostgreSQL实例前了解实例小版本详情,方便按需选择。 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI…

    阿里云数据库 2023年12月9日
  • 阿里云日志服务SLS对接Jaeger-云淘科技

    本文介绍如何使用Jaeger客户端对接日志服务。 背景信息 容器、Serverless编程方式提升了软件交付与部署的效率。在架构的演化过程中,可以看到以下变化。 应用架构从单体系统逐步转变为微服务,其中业务逻辑变为微服务之间的调用与请求。 资源角度来看,传统服务器这个物理单位逐渐淡化,变为了虚拟资源模式。 从以上两个变化可以看到这种弹性、标准化的架构背后,原…

    2023年12月10日
  • 阿里云大数据开发治理平台 DataWorks数据质量:全流程的质量监控-云淘科技

    DataWorks的全流程数据质量监控功能为您提供35种预设表级别、字段级别和自定义的监控模板。 数据质量帮助您第一时间感知到源端数据的变更与ETL(Extract Transformation Load)中产生的脏数据,自动拦截问题任务,有效阻断脏数据向下游蔓延。 说明 ETL是抽取、转换和加载源端数据至目的端的过程。 数据质量以数据集(DataSet)为…

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。