详情页标题前

腾讯云对象存储使用腾讯云 EMR 部署

详情页1

目前 GooseFS 已经集成到了腾讯云 EMR 环境中,将会在最新的 EMR 版本中发布。届时,用户无需针对腾讯云 EMR 环境单独部署,可以像使用其他 EMR 组件一样直接使用 GooseFS。下文将针对未集成 GooseFS 的腾讯云 EMR 存量集群,介绍如何部署配置 GooseFS 的 EMR 环境。首先,参照 集群模式部署运行 章节的内容,选择生产环境合适的部署架构,完成集群部署。
其次,针对 EMR 支持组件进行配置,本文以 Hadoop MapReduce、Spark 以及 Flink 对 GooseFS 的支持来讲解。

Hadoop MapReduce 支持

为了使得 Hadoop 的 MapReduce 作业能够读写 GooseFS 中的数据,需要在 hadoop-env.sh 中将 GooseFS Client 的依赖路径添加到 HADOOP_CLASSPATH,这个操作可以在 EMR 的控制台上完成,如下所示:

腾讯云对象存储使用腾讯云 EMR 部署


同时,还需要配置在 core-site.xml 中配置 GooseFS 的 HCFS 实现,同样这个操作也可以在 EMR 的控制台上完成:配置 fs.AbstractFileSystem.gfs.impl 为如下:

com.qcloud.cos.goosefs.hadoop.GooseFileSystem



腾讯云对象存储使用腾讯云 EMR 部署


配置 fs.gfs.impl 为如下:

com.qcloud.cos.goosefs.hadoop.FileSystem



腾讯云对象存储使用腾讯云 EMR 部署


下发配置后,重启 YARN 相关组件即可生效。

Spark 支持

为了使得 Spark 能够访问goosefs,同样需要配置 GooseFS 的 client 依赖包到 spark 的 executor classpath 中,同时在 spark-defaults.conf 中指定:

...spark.driver.extraClassPath ${GOOSEFS_HOME}/client/goosefs-x.x.x-client.jarspark.executor.extraClassPath ${GOOSEFS_HOME}/client/goosefs-x.x.x-client.jarspark.hadoop.fs.gfs.impl com.qcloud.cos.goosefs.hadoop.FileSystemspark.hadoop.fs.AbstractFileSystem.gfs.impl com.qcloud.cos.goosefs.hadoop.GooseFileSystem...

同样,该操作也可以在 EMR 控制台上 Spark 组件中配置和下发:

腾讯云对象存储使用腾讯云 EMR 部署



腾讯云 EMR 的 Flink 采用的是 Flink on YARN 的部署模式,因此原则上只要确保 ${FLINK_HOME}/flink-conf.yaml 中正确设置 fs.hdfs.adoopconf 到 hadoop 的配置路径下即可,腾讯云 EMR 集群中一般为 /usr/local/service/hadoop/etc/hadoop无需设置其他配置项,直接使用 Flink on YARN 的方式提交 Flink 作业即可,作业中需要访问 GooseFS 的路径为 gfs://master:port/注意 Flink 访问 GooseFS 时,必须指定 master 和 port。

Hive、Impala、HBase、Sqoop 以及 Oozie 支持

当配置 Hadoop MapReduce 的环境支持以后,Hive、Impala、HBase 等组件无需单独配置支持,即可正常使用。
对象存储官网1折活动,限时活动,即将结束,速速收藏
同尘科技为腾讯云授权服务中心。
购买腾讯云产品享受折上折,更有现金返利。同意关联立享优惠

转转请注明出处:https://www.yunxiaoer.com/144880.html

(0)
上一篇 2023年12月9日
下一篇 2023年12月9日
详情页2

相关推荐

  • 阿里云ECS云服务器欠费时的API行为-云淘科技

    本文介绍了因账号欠费或者包年包月资源过期时的API调用情况。 API调用情况 欠费指在DescribeInstances或者DescribeDisks返回的传出参数中的OperationLocks包含了LockReason: financial。 以下列表中,正常逻辑表示按照接口的正常逻辑执行并返回结果。 表 1. 实例欠费时的API行为 接口 实例欠费 A…

    阿里云服务器 2023年12月9日
  • 腾讯云对象存储恢复归档对象

    简介 本文档提供关于恢复归档对象操作相关的 API 概览以及 SDK 示例代码。 API 操作名 操作描述 POST Object restore 恢复归档对象 将归档类型的对象取回访问 恢复归档对象 功能说明 POST Object restore 接口可以对一个通过 COS 归档为 archive 类型的对象进行恢复,恢复出的可读取对象是临时的,您可以设…

    腾讯云 2023年12月9日
  • 腾讯云GPU云服务器关于 GPU 计算型 GN7 vGPU 实例规格下线公告

    GPU 计算型 GN7 的 vGPU 规格(仅指 GN7.LARGE20 和 GN7.2XLARGE40 规格,下同)搭载 NVIDIA vCS License,由于 NVIDIA vCS License 已经停止售卖,现腾讯云也将对 GPU 计算型 GN7 的 vGPU 规格进行下线,不再售卖。如果您有 GPU 云服务器相关需求,推荐您前往选购 GPU 渲…

    腾讯云 2023年12月9日
  • 请问下视觉智能平台需要处理的图片所在的oss区域只能是上海吗?-云小二-阿里云

    请问下需要处理的图片所在的oss区域只能是上海吗? 以下为热心网友提供的参考意见 是的,视觉智能开放平台直接支持的上海oss的图片URL,如果是非上海oss的可以使用文件URL处理的方案。文件URL处理方案:https://help.aliyun.com/zh/viapi/getting-started/the-file-url-processing 以下为…

    2023年12月11日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 腾讯云对象存储文档审核

    简介 内容审核功能是由 数据万象(Cloud Infinite,CI)提供的,数据万象将处理能力与 COS SDK 完全结合,您可以直接按照本篇文档指引进行使用。说明使用内容审核服务需拥有数据万象使用权限:主账号请 单击此处 进行角色授权。子账号请参见 授权子账号接入数据万象服务 文档。本文档提供关于文档审核接口的 API 概览以及 SDK 示例代码。 AP…

    腾讯云 2023年12月9日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。