详情页标题前

阿里云对象存储OSS数据迁移概述-云淘科技

详情页1

本文介绍如何数据迁移OSSOSS-HDFS

将数据迁移至OSS

您可以基于实际业务需求将本地、第三方存储设备或者OSS源存储空间(Bucket)内的数据迁移至OSS目标Bucket,具体如下表所示:

迁移方式

说明

相关文档

在线迁移

使用在线迁移服务,您可以将第三方数据轻松迁移至阿里云对象存储OSS,也可以在对象存储OSS之间进行跨账号、跨地域、以及同地域内灵活的数据迁移。迁移时无需搭建迁移环境,可在线提交迁移任务并随时监控迁移过程。

  • 阿里云OSS之间数据迁移

  • 第三方数据源迁移到OSS

  • 从Amazon S3上的应用无缝切换至OSS

ossimport

适用于各类数据源的历史数据批量迁移到OSS,包括本地、七牛、百度BOS、Amazon S3、Azure Blob、又拍云、腾讯云COS、金山KS3、HTTP、OSS等,并可根据需要扩展。

使用ossimport迁移数据

ossutil

适用于各类数据源的历史数据批量迁移到OSS。

ossutil

镜像回源

适用于客户源站无缝迁移数据到OSS。即服务已在源站或者在其他云产品上运行,需迁移到OSS,但又不能停止服务。在ossimport完成历史数据迁移且业务切换到OSS后,当访问的数据不在OSS,会触发镜像回源到源站抓取,并下载到OSS中。

例如某服务已经在您建立的源站或者在其他云产品上运行。现因业务发展,需要将服务迁移至OSS,迁移时需保证服务的正常运行。您可以在迁移过程中使用镜像回源规则获取未迁移至OSS的部分数据,保证服务的正常运行。

回源概述

OSS跨区域复制

适用于不同地域的源Bucket A与目标Bucket B数据同步场景。

说明

  • 可通过设置跨区域复制功能指定文件名前缀进行同步,只同步特定目录。

  • 不支持将源Bucket中冷归档或者深度冷归档存储类型Object复制到目标Bucket。

跨区域复制概述

离线迁移(闪电立方)

适用于线下数据中心大规模数据迁移上云,支持TB到PB级别数据上云,可通过离线迁移服务将数据迁移至阿里云OSS。

什么是离线迁移(闪电立方)

OSS API或SDK

使用OSS API或SDK编写代码实现数据上云,适用于有特性需求,且具有较强开发能力的用户。

  • OSS API

  • OSS SDK

OSS外部表(gpossext功能)

云原生数据仓库AnalyticDB PostgreSQL版支持通过OSS外部表(gpossext功能),将数据导入或导出阿里云对象存储OSS。

  • 将数据并行从OSS导入到AnalyticDB PostgreSQL

  • 将数据并行导出到OSS

阿里云Jindo DistCp

阿里云Jindo DistCp(分布式文件拷贝工具)用于大规模集群内部或集群之间拷贝文件。Jindo DistCp使用MapReduce实现文件分发,错误处理和恢复,把文件和目录的列表作为MapReduce任务的输入,每个任务会完成源列表中部分文件的拷贝。

从HDFS迁移数据到OSS

将数据迁移至OSS-HDFS

OSS-HDFS服务(JindoFS服务)是一款云原生数据湖存储产品。基于统一的元数据管理能力,在完全兼容HDFS文件系统接口的同时,提供充分的POSIX能力支持,能更好地满足大数据和AI等领域的数据湖计算场景。您可以将数据迁移至OSS-HDFS,或者在OSS-HDFS的不同Bucket之间迁移数据,具体如下:

迁移方式

说明

相关文档

阿里云Jindo DistCp

阿里云Jindo DistCp(分布式文件拷贝工具)用于大规模集群内部或集群之间拷贝文件。Jindo DistCp使用MapReduce实现文件分发,错误处理和恢复,把文件和目录的列表作为MapReduce任务的输入,每个任务会完成源列表中部分文件的拷贝。

  • 从HDFS迁移数据到OSS-HDFS

  • 在OSS-HDFS服务不同Bucket之间迁移数据

JindoDistJob工具

JindoDistJob工具支持半托管JindoFS全量和增量迁移文件元数据,支持您在不迁移数据块的同时平稳切换到JindoFS服务化的方案上。

将半托管JindoFS集群迁移到OSS-HDFS服务

JindoTable MoveTo命令

MoveTo命令可以在拷贝底层数据结束后,自动更新元数据,使表和分区的数据完整地迁移到新路径;可以通过条件筛选,一次拷贝大量分区。在数据迁移过程中,还使用了多种措施保护数据的完整性,确保数据安全。

使用JindoTable MoveTo命令将Hive表和分区数据迁移至OSS-HDFS服务

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/159525.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云日志服务SLS产品架构-云淘科技

    本文介绍日志服务的架构。 日志服务的架构如下图所示: 数据来源 日志服务支持采集开源软件、服务器与应用、阿里云产品、标准协议、移动端、物联网等多种来源的数据。 日志服务 数据类型 日志服务为Log、Metric、Trace等数据提供大规模、低成本、实时的平台化服务。更多信息,请参见日志(Log)、时序数据(Metric)、链路数据(Trace)。 功能特性 …

    阿里云日志服务SLS 2023年12月10日
  • 阿里云对象存储OSSJava进度条-云淘科技

    进度条用于指示上传或下载文件的进度。本文以ossClient.putObject方法为例,介绍如何使用进度条。 注意事项 本文以华东1(杭州)外网Endpoint为例。如果您希望通过与OSS同地域的其他阿里云产品访问OSS,请使用内网Endpoint。关于OSS支持的Region与Endpoint的对应关系,请参见访问域名和数据中心。 本文以从环境变量读取访…

    阿里云对象存储 2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云大数据开发治理平台 DataWorks手动修正数据-云淘科技

    本文将为您介绍如何在手动修正数据页面,对规则识别不准确的数据进行手动修正。 说明 手动修正的数据结果,在第2天才会生效展示。 背景信息 DataWorks支持您对数据识别规则识别不准确的敏感数据进行手动修正,手动修正数据的使用逻辑如下图所示。 手动修正数据进入数据识别规则。详情请参见:进入数据识别规则。 单击手动修正数据页签,进入手动修正数据页面。 手动修正…

    2023年12月10日
  • 阿里云对象存储OSSOSS小时数据-云淘科技

    调用QueryUserOmsData查询OSS按小时计量的数据信息。 请求参数 名称 类型 是否必选 示例值 描述 Action String 是 QueryUserOmsData 系统规定参数,取值为QueryUserOmsData。 DataType String 是 Hour 计量数据时间类型,取值为Hour。 Table String 是 OSS 计…

    阿里云对象存储 2023年12月10日
  • 阿里云日志服务SLS云监控-云淘科技

    您可以通过阿里云云监控服务来监控日志服务的写入流量、总体QPS、服务状态等指标,获取日志服务的使用情况。同时您可以通过创建报警规则,对日志采集、Shard资源使用等异常进行监控。 前提条件 RAM用户查看云监控指标,需要主账户为其授予云监控只读(AliyunCloudMonitorReadOnlyAccess)或读写(AliyunCloudMonitorFu…

    阿里云日志服务SLS 2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。