详情页标题前

阿里云对象存储OSSSpark以EMR集群的方式处理OSS-HDFS服务中的数据-云淘科技

详情页1

本文介绍Spark如何以EMR集群的方式处理OSS-HDFS服务中的数据。

前提条件

  • 已创建EMR-3.42.0及以上版本或EMR-5.8.0及以上版本的集群。具体步骤,请参见创建集群。

  • 已开通并授权访问OSS-HDFS服务。具体操作,请参见开通并授权访问OSS-HDFS服务。

操作步骤

  1. 登录EMR集群。

    1. 登录EMR on ECS控制台。

    2. 单击创建的EMR集群。

    3. 单击节点管理页签,然后单击节点组左侧的阿里云对象存储OSSSpark以EMR集群的方式处理OSS-HDFS服务中的数据-云淘科技

    4. 单击ECS ID。在ECS实例页面,单击实例ID右侧的远程连接

    如果您希望使用SSH方式(SSH密钥对或SSH密码)在Windows和Linux环境中登录集群,请参见登录集群。

  2. 在终端执行以下命令启动Spark Shell。

    spark-shell
  3. 使用Spark访问OSS-HDFS。

    1. 创建表。

      spark.sql("CREATE TABLE test_oss (`c1` string) OPTIONS (PATH 'oss://examplebucket.cn-hangzhou.oss-dls.aliyuncs.com/dir')")
    2. 往表中插入数据。

      spark.sql("INSERT INTO TABLE test_oss SELECT 'testdata' AS c1")
    3. 查询表。

      spark.sql("SELECT c1 FROM test_oss")

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/158958.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云对象存储OSS解冻文件-云淘科技

    如果未开启归档直读,归档类型的Object需要解冻后才能读取。冷归档、深度冷归档不支持开启直读,冷归档、深度冷归档类型的Object需要解冻后才能读取。归档类型Object完成解冻通常需要数分钟。冷归档类型Object完成解冻通常需要数小时。深度冷归档类型Object完成解冻通常需要12~48小时。解冻时间请以实际为准。本文介绍如何解冻归档、冷归档、深度冷归…

    阿里云对象存储 2023年12月10日
  • 阿里云对象存储OSSJava授权策略-云淘科技

    本文介绍如何设置、获取和删除指定存储空间(Bucket)的授权策略(Policy)。 注意事项 本文以华东1(杭州)外网Endpoint为例。如果您希望通过与OSS同地域的其他阿里云产品访问OSS,请使用内网Endpoint。关于OSS支持的Region与Endpoint的对应关系,请参见访问域名和数据中心。 本文以从环境变量读取访问凭证为例。如何配置访问凭…

    阿里云对象存储 2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云日志服务SLS添加多Y轴线图-云淘科技

    当您需要在一个线图中添加不同种类或不同数量级的数据时,可在线图中添加多Y轴。本文介绍添加多Y轴线图的操作步骤。 前提条件 已创建仪表盘。具体操作,请参见创建仪表盘。 已采集网站访问日志到目标Logstore。具体操作,请参见数据采集概述。 已配置索引。具体操作,请参见创建索引。 资源信息与数据样例 公司A将其网站访问日志存储在名为website_log的Lo…

    阿里云日志服务SLS 2023年12月10日
  • 阿里云ECS云服务器部署Linux主机管理系统WDCP-云淘科技

    WDCP(WDlinux Control Panel)是一套Linux服务器及虚拟主机管理系统,通过Web控制和管理服务器。在WDCP的后台中,您可以更方便地使用Linux系统作为网站服务器系统,并对Linux服务器进行管理。 前提条件 已注册阿里云账号。如还未注册,请先完成账号注册。 已创建网络类型为专有网络的安全组,并且安全组的入方向添加规则并放行808…

    阿里云服务器 2023年12月9日
  • 阿里云大数据开发治理平台 DataWorks导入数据至维表-云淘科技

    创建完成维表后,您可以在维表中直接写入数据,也可以导入电子表格、本地CSV文件和Excel文件的数据至维表,为后续数据分析做准备。 前提条件 已创建完成一个维表,详情请参见创建维表。操作步骤在维表页面,单击全部维表下相应的文件名,进入维表的编辑页面。 在维表的编辑页面,单击右上方的导入。在导入对话框中,单击需要导入的文件类型,配置相应的参数。说明 维表仅支持…

    2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。