详情页标题前

阿里云对象存储OSS实时计算Flink读写OSS或者OSS-HDFS-云淘科技

详情页1

阿里云实时计算Flink支持通过连接器读写OSS以及OSS-HDFS数据。通过配置OSS或者OSS-HDFS连接器的输入属性,实时计算Flink会自动从指定的路径读取数据,并将其作为实时计算Flink的输入流,然后将计算结果按照指定格式写入到OSS或者OSS-HDFS的指定路径。

前提条件

  • 已开通Flink全托管。具体操作,请参见开通Flink全托管。

    开通Flink全托管后,Flink全托管页签将在5~10分钟内显示已创建完成的工作空间

  • 已创建SQL作业。

    创建SQL作业时,Flink计算引擎需选择VVR 8.0.1及以上版本。具体操作,请参见新建作业。

使用限制

  • 仅支持读写相同账号下的OSS或者OSS-HDFS服务的数据。

  • 对于写入OSS的场景,暂不支持写Avro、CSV、JSON和Raw此类行存的格式,具体原因请参见FLINK-30635。

操作步骤

  1. 进入SQL作业创建页面。

    1. 登录实时计算控制台。

    2. Flink全托管页签,单击目标工作空间操作列下的控制台

    3. 在左侧导航栏,单击SQL开发

  2. 在SQL作业编辑区域,编写DDL和DML代码。

    将srcbucket中的dir路径下的源表数据写入destbucket的test路径下的结果表。

    说明

    如果您希望通过以下代码读取OSS-HDFS的数据,请确保srcbucket以及destbucket已开通OSS-HDFS服务。

    CREATE TEMPORARY TABLE source_table (
     `file.name` STRING NOT NULL,
     `file.path` STRING NOT NULL METADATA
    ) WITH (
      'connector'='filesystem',
      'path'='oss://srcbucket/dir/',
      'format'='parquet'
    );
    
    CREATE TEMPORARY TABLE target_table(
     `name` STRING,
     `path` STRING 
    ) with (
      'connector'='filesystem',
      'path'='oss://destbucket/test/',
      'format'='parquet'
    );
    
    INSERT INTO target_table SELECT * FROM source_table ;

    关于源表支持的元信息列(例如file.path、file.name等)以及WITH参数的具体用法,请参见对象存储OSS连接器。

  3. 单击保存

  4. 单击深度检查

    深度检查能够检查作业的SQL语义、网络连通性以及作业使用的表的元数据信息。同时,您可以单击结果区域的SQL优化,展开查看SQL风险问题提示以及对应的SQL优化建议。

  5. 单击部署

    完成作业开发和深度检查后,即可部署作业,将数据发布至生产环境。

  6. (可选)仅当您需要读取OSS-HDFS服务的数据时,执行此步骤。

    单击作业,在部署详情页签下的运行参数配置区域,按以下说明配置OSS-HDFS服务访问密钥以及Endpoint等信息,然后单击保存

    fs.oss.jindo.buckets: srcbucket;destbucket
    fs.oss.jindo.accessKeyId: LTAI5t7h6SgiLSganP2m****
    fs.oss.jindo.accessKeySecret: KZo149BD9GLPNiDIEmdQ7dyNKG****
    fs.oss.jindo.endpoint: cn-hangzhou.oss-dls.aliyuncs.com

    各配置项说明如下:

    配置项

    说明

    fs.oss.jindo.buckets

    填写待读取源表数据所在的Bucket名称以及待写入结果表数据所在的Bucket名称。Bucket名称之间以分号分隔,例如srcbucket;destbucket

    fs.oss.jindo.accessKeyId

    阿里云账号或者RAM用户的AccessKey ID。获取方法请参见查看RAM用户的AccessKey信息。

    fs.oss.jindo.accessKeySecret

    阿里云账号或者RAM用户的AccessKey Secret。获取方法请参见查看RAM用户的AccessKey信息。

    fs.oss.jindo.endpoint

    OSS-HDFS服务的Endpoint,例如cn-hangzhou.oss-dls.aliyuncs.com。

  7. 作业运维页面,单击启动,等待作业进入运行状态。

  8. 通过指定的OSS或者OSS-HDFS结果表存储路径path查看写入的数据。

    写入OSS时,您可以通过OSS控制台文件列表下的OSS页签查看写入的数据。写入OSS-HDFS时,您可以通过OSS控制台文件列表下的HDFS页签查看写入的数据。

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/157669.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云对象存储OSSPython范围下载-云淘科技

    如果仅需要文件中的部分数据,您可以使用范围下载,下载指定范围内的数据。 注意事项 本文以华东1(杭州)外网Endpoint为例。如果您希望通过与OSS同地域的其他阿里云产品访问OSS,请使用内网Endpoint。关于OSS支持的Region与Endpoint的对应关系,请参见访问域名和数据中心。 本文以从环境变量读取访问凭证为例。如何配置访问凭证,请参见Py…

    阿里云对象存储 2023年12月10日
  • 阿里云对象存储OSSJava流式下载-云淘科技

    当下载的文件太大或者一次性下载耗时太长时,您可以通过流式下载,一次处理部分内容,直到完成文件的下载。 注意事项 本文以华东1(杭州)外网Endpoint为例。如果您希望通过与OSS同地域的其他阿里云产品访问OSS,请使用内网Endpoint。关于OSS支持的Region与Endpoint的对应关系,请参见访问域名和数据中心。 本文以从环境变量读取访问凭证为例…

    阿里云对象存储 2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云对象存储OSS405错误-云淘科技

    本文介绍OSS返回405错误的原因和解决方案。 MethodNotAllowed The specified method is not allowed against this resource 问题原因:使用了OSS不支持的方法来请求访问资源。 解决方案:请使用API概览中支持的请求方式进行重试。 内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系…

    阿里云对象存储 2023年12月10日
  • 阿里云对象存储OSSBrowser.js上传回调-云淘科技

    您只需要在发送给OSS的请求中携带相应的Callback参数,即可在完成文件(Object)上传时提供回调(Callback)给应用服务器。 注意事项 当您使用webpack或browserify等打包工具时,请通过npm install ali-oss的方式安装Browser.js SDK。 通过浏览器访问OSS时涉及跨域请求,如果未设置跨域规则,浏览器会…

    阿里云对象存储 2023年12月10日
  • 阿里云对象存储OSSJava获取存储空间的地域-云淘科技

    存储空间(Bucket)是存储对象(Object)的容器。对象都隶属于存储空间。本文介绍如何获取存储空间所在的地域。 注意事项 本文以华东1(杭州)外网Endpoint为例。如果您希望通过与OSS同地域的其他阿里云产品访问OSS,请使用内网Endpoint。关于OSS支持的Region与Endpoint的对应关系,请参见访问域名和数据中心。 本文以从环境变量…

    阿里云对象存储 2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。