详情页标题前

阿里云对象存储OSSSpark以EMR集群的方式处理OSS-HDFS服务中的数据-云淘科技

2023年12月10日上午1:32 • 阿里云对象存储

详情页1

本文介绍Spark如何以EMR集群的方式处理OSS-HDFS服务中的数据。

前提条件

已创建EMR-3.42.0及以上版本或EMR-5.8.0及以上版本的集群。具体步骤，请参见创建集群。
已开通并授权访问OSS-HDFS服务。具体操作，请参见开通并授权访问OSS-HDFS服务。

操作步骤

登录EMR集群。
1. 登录EMR on ECS控制台。
2. 单击创建的EMR集群。
3. 单击节点管理页签，然后单击节点组左侧的。
4. 单击ECS ID。在ECS实例页面，单击实例ID右侧的远程连接。
如果您希望使用SSH方式（SSH密钥对或SSH密码）在Windows和Linux环境中登录集群，请参见登录集群。
在终端执行以下命令启动Spark Shell。
```
spark-shell
```

使用Spark访问OSS-HDFS。

创建表。

spark.sql("CREATE TABLE test_oss (`c1` string) OPTIONS (PATH 'oss://examplebucket.cn-hangzhou.oss-dls.aliyuncs.com/dir')")

往表中插入数据。

spark.sql("INSERT INTO TABLE test_oss SELECT 'testdata' AS c1")

查询表。
```
spark.sql("SELECT c1 FROM test_oss")
```

内容没看懂？不太想学习？想快速解决？有偿解决：联系专家

阿里云企业补贴进行中：马上申请

腾讯云限时活动1折起，即将结束：马上收藏

 同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折，更有现金返利:同意关联，立享优惠

转转请注明出处：https://www.yunxiaoer.com/158958.html

c1 EMR OSS Spark 单击集群

赞 (0)

0

阿里云对象存储OSS通过SLS完成日志数据入湖OSS-云淘科技

上一篇 2023年12月10日

阿里云对象存储OSSSqoop以EMR集群的方式读写OSS-HDFS服务的数据-云淘科技

下一篇 2023年12月10日

详情页2

阿里云对象存储OSS解冻文件-云淘科技

如果未开启归档直读，归档类型的Object需要解冻后才能读取。冷归档、深度冷归档不支持开启直读，冷归档、深度冷归档类型的Object需要解冻后才能读取。归档类型Object完成解冻通常需要数分钟。冷归档类型Object完成解冻通常需要数小时。深度冷归档类型Object完成解冻通常需要12～48小时。解冻时间请以实际为准。本文介绍如何解冻归档、冷归档、深度冷归…

阿里云对象存储 2023年12月10日
0
阿里云对象存储OSSJava授权策略-云淘科技

本文介绍如何设置、获取和删除指定存储空间（Bucket）的授权策略（Policy）。注意事项本文以华东1（杭州）外网Endpoint为例。如果您希望通过与OSS同地域的其他阿里云产品访问OSS，请使用内网Endpoint。关于OSS支持的Region与Endpoint的对应关系，请参见访问域名和数据中心。本文以从环境变量读取访问凭证为例。如何配置访问凭…

阿里云对象存储 2023年12月10日
0
信息流广告，信息流部分建议宽度830px，只针对默认列表样式，顺序随机
阿里云日志服务SLS添加多Y轴线图-云淘科技

当您需要在一个线图中添加不同种类或不同数量级的数据时，可在线图中添加多Y轴。本文介绍添加多Y轴线图的操作步骤。前提条件已创建仪表盘。具体操作，请参见创建仪表盘。已采集网站访问日志到目标Logstore。具体操作，请参见数据采集概述。已配置索引。具体操作，请参见创建索引。资源信息与数据样例公司A将其网站访问日志存储在名为website_log的Lo…

阿里云日志服务SLS 2023年12月10日
0
阿里云ECS云服务器部署Linux主机管理系统WDCP-云淘科技

WDCP（WDlinux Control Panel）是一套Linux服务器及虚拟主机管理系统，通过Web控制和管理服务器。在WDCP的后台中，您可以更方便地使用Linux系统作为网站服务器系统，并对Linux服务器进行管理。前提条件已注册阿里云账号。如还未注册，请先完成账号注册。已创建网络类型为专有网络的安全组，并且安全组的入方向添加规则并放行808…

阿里云服务器 2023年12月9日
0
阿里云大数据开发治理平台 DataWorks

阿里云大数据开发治理平台 DataWorks导入数据至维表-云淘科技

创建完成维表后，您可以在维表中直接写入数据，也可以导入电子表格、本地CSV文件和Excel文件的数据至维表，为后续数据分析做准备。前提条件已创建完成一个维表，详情请参见创建维表。操作步骤在维表页面，单击全部维表下相应的文件名，进入维表的编辑页面。在维表的编辑页面，单击右上方的导入。在导入对话框中，单击需要导入的文件类型，配置相应的参数。说明维表仅支持…

2023年12月10日
0

联系我们

400-800-8888

在线咨询： QQ交谈

邮件：admin@example.com

工作时间：周一至周五，9:30-18:30，节假日休息

关注微信

本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买，续费优惠，保证底价，买贵退差。