详情页标题前

阿里云对象存储OSSOSS-HDFS服务的元数据转换-云淘科技

详情页1

OSS-HDFS服务支持在未部署任何导入和导出工具的情况下,直接将OSS元数据转换为OSS-HDFS元数据。

前提条件

  • 已开通并授权访问OSS-HDFS服务。具体步骤,请参见开通并授权访问OSS-HDFS服务。
  • 仅华北3(张家口)地域支持将OSS元数据转换为OSS-HDFS元数据。
  • 已提交工单申请使用OSS-HDFS服务的元数据转换功能。

使用限制

不支持将以下类型的OSS元数据转换为OSS-HDFS元数据:

  • 归档类型Object
  • 冷归档类型Object
  • 软链接Symlink
  • 通过追加上传方式生成的Appendable类型Object
  • 通过SSE-KMS或者SSE-OSS加密的Object

风险说明

元数据转换任务开始执行后,请勿执行以下操作,否则导致转换任务失败。

  • 请勿删除文件

    如果删除被转换的文件,可能导致转换时找不到文件,造成转换任务执行失败。

  • 请勿覆写文件

    如果覆写被转换的文件,可能导致覆写的内容不会被转换。

  • 请勿在OSS-HDFS目的端上传同名文件

    如果在OSS-HDFS目的端上传同名文件,可能导致文件名冲突,造成转换任务执行失败。

  • 请勿修改转换任务执行角色的权限

    如果修改了转换任务执行角色AliyunOSSDLSTransferRole或者AliyunOSSRole的权限,可能导致无权限执行转换任务,造成转换任务执行失败。

  • 请确保OSS中不存在同名文件和文件夹

    如果转换任务配置的前缀匹配了同名文件和文件夹,例如配置的转换任务前缀为dir,OSS中存在文件dir以及文件夹dir/,可能出现只转换文件或者文件夹,或者转换任务失败,具体以任务运行时的导入顺序为准。

操作步骤

  1. 新建数据转换任务。
    1. 登录OSS管理控制台。
    2. 单击Bucket列表,然后单击目标Bucket名称。
    3. 在左侧导航栏,选择数据湖管理 > 数据转换。
    4. 单击新建数据转换任务。重要 默认情况下,最多支持配置3条转换任务。
    5. 在数据转换任务配置页面,按以下说明配置必要参数,其他参数保留默认配置。
      参数 说明
      命中前缀 指定需要将哪些前缀的OSS数据转换为OSS-HDFS,最多可支持指定10个前缀。
      授权角色 下拉选择新建角色,然后按照页面指引完成AliyunOSSDLSTransferRole角色的创建操作,该角色用于授权数据转换功能访问您的云资源。重要 如果您此前已拥有AliyunOSSRole角色,也可以选择使用该角色授权数据转换功能访问您的云资源。
    6. 单击下一步,然后单击确定。此时,任务处于空闲状态。
  2. 单击当前任务右侧操作栏下的启动任务。此时,任务处于运行中状态,该状态下后台将扫描命中的文件,大约需要1小时完成扫描。待转换任务完成后,任务将返回空闲状态。
  3. 可选:单击当前任务右侧操作栏下的历史记录,查看导入信息。阿里云对象存储OSSOSS-HDFS服务的元数据转换-云淘科技

    转换完成后,您可以在数据导入目录下查看已成功转换的文件,还可以前往导入的错误信息目录下查看转换失败的原因。

  4. 可选:如果您在上一次转换任务完成后,需要对与指定前缀匹配的OSS元数据进行增量转换,请再次单击启动任务。重要 执行增量转换任务过程中,会产生大量的重复数据,占用额外的存储空间。因此,在执行增量转换任务之前,建议您先清理已转换完成的文件。

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/158836.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云RDS数据库开启和关闭实例释放保护-云淘科技

    如果您的RDS PostgreSQL按量付费实例承载了关键业务,可以为按量付费实例开启实例释放保护,防止手动释放按量付费实例,有效避免因操作疏忽、团队成员沟通不及时等原因造成不可挽回的后果。本文为您介绍如何开启和关闭实例释放保护。 前提条件 实例的付费类型为按量付费。 注意事项 实例释放保护不能阻止因合理原因自动执行的释放行为,包括但不限于: 账号欠费超过1…

    阿里云数据库 2023年12月9日
  • 阿里云对象存储OSSRuby管理文件概述-云淘科技

    您可以通过一系列的接口管理存储空间(Bucket)下的文件(Object),包括以下操作: Ruby管理文件访问权限 Ruby管理文件元信息 Ruby列举文件 Ruby删除文件 Ruby拷贝文件 内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家阿里云企业补贴进行中: 马上申请腾讯云限时活动1折起,即将结束: 马上收藏同尘科技为腾讯云授权服务中心。…

    阿里云对象存储 2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云对象存储OSSGo管理文件访问权限-云淘科技

    本文介绍如何管理文件访问权限。 注意事项 本文以华东1(杭州)外网Endpoint为例。如果您希望通过与OSS同地域的其他阿里云产品访问OSS,请使用内网Endpoint。关于OSS支持的Region与Endpoint的对应关系,请参见访问域名和数据中心。 本文以从环境变量读取访问凭证为例。如何配置访问凭证,请参见Go配置访问凭证。 本文以OSS域名新建OS…

    阿里云对象存储 2023年12月10日
  • 阿里云日志服务SLS关联Logstore与OSS外表进行查询和分析-云淘科技

    在进行日志数据查询和分析时,经常需要结合外部表格对日志数据进行分析。本文介绍如何在日志服务中联合OSS外表进行数据分析。 前提条件 持续采集日志。具体操作,请参见数据采集。 已创建索引。具体操作,请参见创建索引。 已创建OSS Bucket。具体操作,请参见控制台创建存储空间。 背景信息 某支付公司,想要分析用户年龄、地域、性别等因素对支付习惯的影响。该公司…

    2023年12月10日
  • 阿里云容器服务ACK配置集群的弹性伸缩-云淘科技

    ACK Serverless集群基于阿里云弹性容器实例服务提供了强大的弹性伸缩能力。依照制定的策略,ACK Serverless集群的算力可以在短时间内增长到原先的数倍,或在算力需求回落时快速缩容以节省成本。本文向您介绍如何直接控制集群中的Pod数量或配置基于负载的自动伸缩策略。 重要 完成本教程预计产生3元左右的费用(假设您的资源运行0.5 小时)。请在完…

    2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。