详情页标题前

阿里云云原生大数据计算服务 MaxComputeSpark访问OSS-云淘科技

详情页1

本文为您介绍使用Spark访问OSS时需要的相关配置。

OSS Endpoint配置

调试时请使用OSS服务所在地域的外网Endpoint,提交集群需替换为VPC内网Endpoint。详情请参见访问域名和数据中心。

OSS访问方式配置

  • 以AccessKey ID和AccessKey Secret方式访问OSS。

    spark.hadoop.fs.oss.accessKeyId = xxxxxx
    spark.hadoop.fs.oss.accessKeySecret = xxxxxx
    spark.hadoop.fs.oss.endpoint = oss-xxxxxx-internal.aliyuncs.com
  • 以StsToken的方式访问OSS。

    以AccessKey ID和AccessKey Secret方式访问OSS,需要明文将AccessKey ID和AccessKey Secret写在配置中,存在一定的安全风险。因此建议您以StsToken的方式访问OSS。

    1. 单击一键授权,将当前云账号的OSS资源通过StsToken的方式授权给MaxCompute项目直接访问。

      说明

      当MaxCompute的ProjectOwner为OSS云账号时,才可以执行一键授权。

    2. 获取roleArn。

      1. 登录RAM控制台。

      2. 在左侧导航栏上,选择身份管理 > 角色

      3. 角色页面,搜索AliyunODPSDefaultRole。

      4. 单击AliyunODPSDefaultRole,在基本信息区域获取ARN。格式为acs:ram::xxxxxxxxxxxxxxx:role/aliyunodpsdefaultrole

    3. 在Spark配置中添加如下内容即可访问OSS资源。

      # 此配置表明Spark是通过StsToken去访问OSS资源。
      spark.hadoop.fs.oss.credentials.provider=org.apache.hadoop.fs.aliyun.oss.AliyunStsTokenCredentialsProvider
      
      # 此配置是一键授权后产生的一个roleArn。
      spark.hadoop.fs.oss.ststoken.roleArn=acs:ram::xxxxxxxxxxxxxxx:role/aliyunodpsdefaultrole
      
      # 此配置是OSS资源对应的VPC访问Endpoint。
      spark.hadoop.fs.oss.endpoint=oss-cn-hangzhou-internal.aliyuncs.com

网络白名单配置

默认情况下无需配置网络白名单即可访问OSS。

特殊情况下(例如用户的OSS Bucket为大流量类型),如果无法访问OSS,需要配置如下信息。

spark.hadoop.odps.cupid.trusted.services.access.list=[your_bucket_name].oss-xxxxxx-internal.aliyuncs.com

说明

该配置在yarn-cluster模式使用,且该配置项必须放在配置文件或命令行提交参数中。

使用jindo-sdk访问OSS

在SparkConf中设置spark.hadoop.fs.AbstractFileSystem.oss.implspark.hadoop.fs.oss.impl,示例代码如下。

val conf = new SparkConf()
  .setAppName("jindo-sdk-demo")
  .set("spark.hadoop.fs.AbstractFileSystem.oss.impl", "com.aliyun.emr.fs.oss.OSS")
  .set("spark.hadoop.fs.oss.impl", "com.aliyun.emr.fs.oss.JindoOssFileSystem")

说明

必须设置spark.hadoop.fs.oss.impl,否则会报”No FileSystem for scheme: oss”的错误。

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/156932.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。