详情页标题前

阿里云对象存储OSSOSS-HDFS服务的冷热分层存储-云淘科技

详情页1

并不是所有OSS-HDFS中存储的数据都需要频繁访问,但基于数据合规或者存档等原因,部分数据仍然需要继续保存。针对以上问题,OSS-HDFS服务支持数据的冷热分层存储,对于经常需要访问的数据以标准类型进行存储,对于较少访问的数据以低频、归档以及冷归档类型进行存储,从而降低总存储成本。

前提条件

  • 已在OSS-HDFS服务中写入数据。

  • 华东1(杭州)、华东2(上海)、华北2(北京)、华南1(深圳)、华北3(张家口)、中国香港、新加坡、德国(法兰克福)、美国(硅谷)、美国(弗吉尼亚)、印度尼西亚(雅加达)地域支持使用冷热分层存储功能。

  • 已提交工单申请使用冷热分层存储功能。

  • 已配置4.4.0及以上版本JindoSDK 。具体操作,请参见非EMR集群接入OSS-HDFS服务快速入门。

注意事项

  • 当您需要读取OSS-HDFS归档类型数据时,涉及数据取回费用。因此对于需要频繁访问的数据,应避免使用低频、归档以及冷归档类型。关于这三种类型数据取回费用的更多信息,请参见数据处理费用。

  • 为OSS-HDFS服务的数据设置存储策略时,涉及数据块添加标签操作。数据块标签费用遵循OSS对象标签计费规则。更多信息,请参见对象标签费用。

  • 不支持在设置为低频、归档以及冷归档存储类型的目录下创建文件。如果您需要在这三种类型的目录下创建文件,可以在标准类型目录下创建并关闭文件后,通过rename操作转移到低频、归档以及冷归档目录。

  • 数据转换为归档或者冷归档存储类型时,系统开销大,解冻取回慢,请谨慎选择。

  • 不支持数据在归档和冷归档存储类型之间相互转换。

操作步骤

  1. 指定为写入OSS-HDFS服务的数据设置存储策略。

    场景

    执行命令

    执行结果

    为写入OSS-HDFS服务的数据设置存储策略为低频访问存储

    jindo fs -setStoragePolicy -path oss://examplebucket/dir1 -policy CLOUD_IA

    dir1/目录下的文件对应的数据块会携带Key为transition-storage-class、Value为IA的标签信息。

    为写入OSS-HDFS服务的数据设置存储策略为归档存储

    jindo fs -setStoragePolicy -path oss://examplebucket/dir2 -policy CLOUD_AR

    dir2/目录下的文件对应的数据块会携带Key为transition-storage-class、Value为Archive的标签信息。

    为写入OSS-HDFS服务的数据设置存储策略为冷归档存储

    jindo fs -setStoragePolicy -path oss://examplebucket/dir3 -policy CLOUD_COLD_AR

    dir3/目录下的文件对应的数据块会携带Key为transition-storage-class、Value为ColdArchive的标签信息。

  2. 开启冷热分层存储。

    1. 登录OSS管理控制台。

    2. 单击左侧导航栏的Bucket列表,然后单击目标Bucket。

    3. 在左侧导航栏,选择数据湖管理 > HDFS服务

    4. HDFS服务页签,单击设置冷热分层。

    5. 冷热分层冷热分层基础设置区域,打开状态开关。

      阿里云对象存储OSSOSS-HDFS服务的冷热分层存储-云淘科技

      为避免配置错误导致冷热分层无法正常工作,OSS会自动创建同时包含以下三种策略的生命周期规则:

      • 指定OSS-HDFS的数据存储目录.dlsdata/下携带Key为transition-storage-class、Value为IA标签的数据在1天后转为低频访问存储。

      • 指定OSS-HDFS的数据存储目录.dlsdata/下携带Key为transition-storage-class、Value为Archive标签的数据在1天后转为归档存储。

      • 指定OSS-HDFS的数据存储目录.dlsdata/下携带Key为transition-storage-class、Value为ColdArchive标签的数据在1天后转为冷归档存储。

      重要

      请勿编辑分层存储开启后自动创建的包含转换为低频、归档以及冷归档类型三种策略的生命周期规则,否则可能导致OSS-HDFS数据及服务异常。

    6. 单击确定

      • OSS-HDFS服务会根据步骤1设置的存储策略应用生命周期中对应的转储策略。

      • 生命周期规则创建后的24小时内,OSS会加载规则。规则加载完成后,OSS会在每天的北京时间08:00开始执行规则,具体执行时间取决于文件数量,最快48小时内转换为指定的存储类型。

相关命令

命令语法

使用说明

jindo fs -setStoragePolicy -path  -policy 

该命令用于为某个路径下的数据指定存储策略。

  • -path:指定文件或目录所在路径。

  • -policy:指定存储策略。可选值为:

    • CLOUD_STD:标准存储。

    • CLOUD_IA:低频访问

    • CLOUD_AR:归档存储。

    • CLOUD_COLD_AR:冷归档存储

在没有对文件或子目录设置存储类型的情况下,文件或子目录的存储策略默认继承父目录的存储类型。例如oss://examplebucket/dir的存储类型为CLOUD_STD,则oss://examplebucket/dir/subdir存储类型也为CLOUD_STD。

jindo fs -getStoragePolicy -path 

该命令用于查询指定路径下数据的存储策略。

jindo fs -unsetStoragePolicy -path 

该命令用于取消指定路径下的数据的存储策略。

jindo fs -checkStoragePolicy -path 

该命令用于查询指定路径下数据存储策略的转换状态。转换状态分为以下三种:

  • Pending:任务等待提交。

  • Submitted:任务已提交。

  • Finalized:任务已完成。

常见问题

如果误删除冷热分层对应的生命周期规则怎么办?

开启冷热分层后,OSS会自动创建同时包含转换为低频、归档以及冷归档类型三种策略的生命周期规则。如果您误删除了其中一种或多种策略的生命周期规则,可能会造成数据无法执行冷热分层存储。

解决方法:

  1. 关闭冷热分层存储。

    1. 单击设置

      阿里云对象存储OSSOSS-HDFS服务的冷热分层存储-云淘科技

    2. 冷热分层冷热分层基础设置区域,关闭状态开关,然后单击确定

      阿里云对象存储OSSOSS-HDFS服务的冷热分层存储-云淘科技

    3. 在弹出的对话框中单击确定

  2. 重新设置生命周期规则。

    1. HDFS服务页签,单击设置冷热分层。

    2. 冷热分层冷热分层基础设置区域,打开状态开关。

    3. 单击确定

      OSS将重新为您创建包含转换为低频、归档以及冷归档类型三种策略的生命周期规则。

是否支持将归档或者冷归档类型文件转换为标准或者低频访问类型?

支持。例如,您希望将归档类型转换为标准存储类型,则通过-policy选项将存储策略指定为CLOUD_STD。

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/158823.html

(0)
上一篇 2023年12月10日 上午1:27
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云对象存储OSS数据迁移概述-云淘科技

    本文介绍如何数据迁移至OSS或OSS-HDFS。 将数据迁移至OSS 您可以基于实际业务需求将本地、第三方存储设备或者OSS源存储空间(Bucket)内的数据迁移至OSS目标Bucket,具体如下表所示: 迁移方式 说明 相关文档 在线迁移 使用在线迁移服务,您可以将第三方数据轻松迁移至阿里云对象存储OSS,也可以在对象存储OSS之间进行跨账号、跨地域、以及…

    阿里云对象存储 2023年12月10日
  • 阿里云对象存储OSS开通并授权访问OSS-HDFS服务-云淘科技

    本文介绍如何开通并授权访问OSS-HDFS服务。 前提条件 华东1(杭州)、华东2(上海)、华北1(青岛)、华北2(北京)、华北6(乌兰察布)、华南1(深圳)、华南3(广州)、华北3(张家口)、中国香港、日本(东京)、新加坡、德国(法兰克福)、美国(硅谷)、美国(弗吉尼亚)、印度尼西亚(雅加达)地域的存储空间支持使用OSS-HDFS服务。无地域属性的存储空间…

    阿里云对象存储 2023年12月10日
  • 阿里云对象存储OSS导出OSS-HDFS服务审计日志-云淘科技

    OSS-HDFS服务端记录了客户端请求的查询、修改、删除文件元数据的操作审计日志。 您可以通过审计日志,了解OSS-HDFS服务操作审计、访问统计以及异常请求等情况。 前提条件 使用4.6.0及以上版本JindoSDK。下载地址,请参见JindoData下载。 配置OSS-HDFS服务下Bucket的访问密钥。 具体操作,请参见通过Jindo CLI命令访问…

    阿里云对象存储 2023年12月10日
  • 阿里云对象存储OSS删除存储空间-云淘科技

    当您不再需要保留某个存储空间(Bucket)时,可将其删除,以免产生额外费用。 警告 删除Bucket后,Bucket中的数据无法恢复,请在删除前确认数据已不再使用。如果需要继续使用Bucket中的数据,请提前做好备份。关于备份的更多信息,请参见备份存储空间。 前提条件 已删除Bucket中所有的文件(Object)。 手动删除少量文件。具体操作,请参见删除…

    阿里云对象存储 2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云对象存储OSS实时计算Flink读写OSS或者OSS-HDFS-云淘科技

    阿里云实时计算Flink支持通过连接器读写OSS以及OSS-HDFS数据。通过配置OSS或者OSS-HDFS连接器的输入属性,实时计算Flink会自动从指定的路径读取数据,并将其作为实时计算Flink的输入流,然后将计算结果按照指定格式写入到OSS或者OSS-HDFS的指定路径。 前提条件 已开通Flink全托管。具体操作,请参见开通Flink全托管。 开通…

    阿里云对象存储 2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。