详情页标题前

阿里云云原生大数据计算服务 MaxCompute迁移ECS自建MySQL数据库至MaxCompute-云淘科技

详情页1

本文为您介绍如何使用独享数据集成资源,将您在ECS上自建的MySQL数据库中的数据,迁移到MaxCompute

前提条件

  • 已拥有至少一个绑定专有网络VPC的ECS(请勿使用经典网络),并在ECS上安装好MySQL数据库,数据库中已创建好用户和测试数据。本文中ECS自建MySQL的测试数据创建语句如下。

    CREATE TABLE IF NOT EXISTS good_sale(
       create_time timestamp,
       category varchar(20),
       brand varchar(20),
       buyer_id varchar(20),
       trans_num varchar(20),
       trans_amount DOUBLE,
       click_cnt varchar(20)
       );
    insert into good_sale values('2018-08-21','coat','brandA','lilei',3,500.6,7),
    ('2018-08-22','food','brandB','lilei',1,303,8),
    ('2018-08-22','coat','brandC','hanmeimei',2,510,2),
    ('2018-08-22','bath','brandA','hanmeimei',1,442.5,1),
    ('2018-08-22','food','brandD','hanmeimei',2,234,3),
    ('2018-08-23','coat','brandB','jimmy',9,2000,7),
    ('2018-08-23','food','brandA','jimmy',5,45.1,5),
    ('2018-08-23','coat','brandE','jimmy',5,100.2,4),
    ('2018-08-24','food','brandG','peiqi',10,5560,7),
    ('2018-08-24','bath','brandF','peiqi',1,445.6,2),
    ('2018-08-24','coat','brandA','ray',3,777,3),
    ('2018-08-24','bath','brandG','ray',3,122,3),
    ('2018-08-24','coat','brandC','ray',1,62,7) ;
  • 请记录好您的ECS的私有IP专有网络虚拟交换机信息。阿里云云原生大数据计算服务 MaxCompute迁移ECS自建MySQL数据库至MaxCompute-云淘科技

  • ECS上的安全组已放通MySQL数据库所使用的端口(默认为3306),详情请参见添加安全组规则,请记录好您的安全组名称。

  • 已成功创建DataWorks工作空间。本文使用DataWorks简单模式工作空间,计算引擎为MaxCompute。请保证您的ECS与DataWorks工作空间处于同一个地域,创建方法请参见创建工作空间。

  • 已完成独享数据集成资源的购买,并且绑定了ECS所在的专有网络VPC。请注意独享资源组必须与ECS同一可用区,详情请参见新增和使用独享数据集成资源组。完成绑定后,您可以在资源组列表查看到您的独享资源组。

  • 网络设置 > 专有网络绑定处查看专有网络交换机安全组信息是否和ECS一致。阿里云云原生大数据计算服务 MaxCompute迁移ECS自建MySQL数据库至MaxCompute-云淘科技

背景信息

独享资源可以保障您的数据快速、稳定地传输。您购买的独享数据集成资源和需要访问的数据源(即本文中的ECS自建MySQL数据库)必须在同地域同可用区,且和DataWorks工作空间同地域。

操作步骤

  1. 在DataWorks上创建MySQL数据源。

    1. 进入数据源页面。

      1. 登录DataWorks控制台,单击左侧导航栏的管理中心,在下拉框中选择对应工作空间后单击进入管理中心

      2. 进入工作空间管理中心页面后,单击左侧导航栏的数据源,进入数据源页面。

    2. 单击数据源页面的新增数据源

    3. 新增数据源对话框,单击MySQL

    4. 新增MySQL数据源对话框中,配置各项参数,详情请参见配置MySQL数据源。

      本文以连接串模式为例,在JDBC URL处输入您刚刚记录的ECS私有地址和MySQL的默认端口号3306。阿里云云原生大数据计算服务 MaxCompute迁移ECS自建MySQL数据库至MaxCompute-云淘科技

      说明

      当前VPC环境下的自建MySQL数据源暂不支持测试连通性,因此连通性测试失败是正常现象。

    5. 单击相应资源组后的测试连通性

      数据同步时,一个任务只能使用一种资源组。您需要在每种资源组上单独测试连通性,以保证同步任务使用的数据集成资源组能够与数据源连通,否则将无法正常执行数据同步任务。详情请参见配置资源组与网络连通。

    6. 测试连通性通过后,单击完成

  2. 创建MaxCompute表。

    您需要通过DataWorks创建一个表,用于接收来自MySQL的测试数据。

    1. 单击左上角的阿里云云原生大数据计算服务 MaxCompute迁移ECS自建MySQL数据库至MaxCompute-云淘科技图标,选择全部产品 > 数据开发与运维 > DataStudio(数据开发)

    2. 新建一个业务流程,详情请参见创建周期业务流程。

    3. 右键单击新建的业务流程,选择新建表 > MaxCompute >

    4. 输入您的MaxCompute表名称,本例中使用和MySQL数据库表一样的名称good_sale。单击DDL后,输入您的建表语句并生成表结构

      本例中使用的建表语句如下,请注意数据类型的转换。

      CREATE TABLE IF NOT EXISTS good_sale(
         create_time string,
         category STRING,
         brand STRING,
         buyer_id STRING,
         trans_num BIGINT,
         trans_amount DOUBLE,
         click_cnt BIGINT
         );
    5. 输入表的中文名后,单击提交到生产环境,完成MaxCompute表good_sale的创建。

      阿里云云原生大数据计算服务 MaxCompute迁移ECS自建MySQL数据库至MaxCompute-云淘科技

  3. 配置数据集成任务。

    1. 右键单击业务流程,选择新建节点 > 数据集成 > 离线同步,创建一个数据集成任务。

    2. 选择您的数据来源为您刚添加的MySQl数据源,数据去向为默认MaxCompute数据源odps_first,单击转换脚本切换数据集成任务为脚本模式。

      此时,如果产生报错或您无法选择数据来源的,都属于正常现象,直接转换为脚本模式即可。阿里云云原生大数据计算服务 MaxCompute迁移ECS自建MySQL数据库至MaxCompute-云淘科技

    3. 单击页面右侧的数据集成资源组配置,选中已购买的独享资源组。

      如果未切换任务资源组为数据集成独享资源,后续您的任务将无法成功运行。

    4. 填写数据集成任务脚本内容如下。

      {
          "type": "job",
          "steps": [
              {
                  "stepType": "mysql",
                  "parameter": {
                      "column": [//源列名
                          "create_time",
                          "category",
                          "brand",
                          "buyer_id",
                          "trans_num",
                          "trans_amount",
                          "click_cnt"
                      ],
                      "connection": [
                          {
                              "datasource": "shuai",//源数据源
                              "table": [
                                  "good_sale"//源数据库表名,此处必须为方括号数组格式。
                              ]
                          }
                      ],
                      "where": "",
                      "splitPk": "",
                      "encoding": "UTF-8"
                  },
                  "name": "Reader",
                  "category": "reader"
              },
              {
                  "stepType": "odps",
                  "parameter": {
                      "partition": "",
                      "truncate": true,
                      "datasource": "odps_first",//目标数据源
                      "column": [//目标列名
                          "create_time",
                          "category",
                          "brand",
                          "buyer_id",
                          "trans_num",
                          "trans_amount",
                          "click_cnt"
                      ],
                      "emptyAsNull": false,
                      "table": "good_sale"//目标表名
                  },
                  "name": "Writer",
                  "category": "writer"
              }
          ],
          "version": "2.0",
          "order": {
              "hops": [
                  {
                      "from": "Reader",
                      "to": "Writer"
                  }
              ]
          },
          "setting": {
              "errorLimit": {
                  "record": "0"
              },
              "speed": {
                  "throttle": false,
                  "concurrent": 2
              }
          }
      }
    5. 单击运行,您可以在下方的运行日志查看数据是否已传输到MaxCompute。

      阿里云云原生大数据计算服务 MaxCompute迁移ECS自建MySQL数据库至MaxCompute-云淘科技

执行结果

您可以新建一个ODPS SQL类型的节点,用于查询当前MaxCompute表中的数据。

输入您的查询语句select * from good_sale ;,单击运行,即可看到当前已传入MaxCompute表中的数据。阿里云云原生大数据计算服务 MaxCompute迁移ECS自建MySQL数据库至MaxCompute-云淘科技

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/158740.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

  • 腾讯云对象存储任务回调

    功能说明 数据万象支持自定义设置回调 URL,在任务完成后,系统向该 URL 发送 HTTP POST 请求,请求体中包含通知内容。您可通过配置的回调地址及时了解任务处理的进展和状态,以便进行其他业务操作。 回调内容 任务完成后,系统会向您设置的回调地址发送回调内容,包含完整节点数据的内容展示如下: TaskFinish Success 2022-06-30…

    腾讯云 2023年12月9日
  • 腾讯云轻量应用服务器快速创建 Linux 实例云小二

    本入门教程将向您展示如何快速选购并使用轻量应用服务器。 步骤1:注册和充值 1. 注册腾讯云账号,并进行实名认证。如果您已在腾讯云注册,可忽略此步骤。2. 在线充值。轻量应用服务器以包年包月模式售卖,购买前,需要在账号中进行充值。具体操作请参见 在线充值 文档。 步骤2:购买轻量应用服务器 Linux 实例 1. 登录 轻量应用服务器控制台。2. 单击新建…

    2023年12月9日
  • 腾讯云云函数(SCF)函数存储选型-云淘科技

    云函数 SCF 提供的是弹性按量计算的 Faas 服务,可作为 Workload 承载众多 Serverless 应用。SCF 在运行时,开发者会由于业务需求访问各类外部数据,如导入第三方库、非结构化数据以及函数计算输出,这就需要云函数 SCF 提供丰富的存储支持类型,以支持开发者的业务需要。云函数 SCF 目前已支持的存储类型,其中包括对接云上的其他云产品…

    2023年12月9日
  • 腾讯云对象存储对象访问 URL

    简介 本文档提供获取已上传到存储的对象访问 URL 的代码示例。 获取对象访问 URL 功能说明 查询对象访问的 URL,该接口不会判断对象是否真实存在。说明如何使生成的对象 URL 在浏览器中打开是预览,而不是下载:在获取的 url 后拼接参数 response-content-disposition=inline。如何使生成的对象 URL 在浏览器中打开…

    腾讯云 2023年12月9日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 腾讯云云函数(SCF)使用方法-云淘科技

    本篇文档将为您指导,如何创建定时触发器并完成函数的调用。 步骤1:创建函数 登录 Serverless控制台,在新建函数页面,完成您的函数代码上传与部署。详情可参见 使用控制台创建一个事件函数。n本文以定时事件示例模板为例,创建函数项目,模板默认创建流程中,直接配置触发器。如下图所示:n 实际创建中,您也可以在项目创建完成后再进行触发器配置,操作详情见 …

    2023年12月9日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。