详情页标题前

阿里云大数据开发治理平台 DataWorks建表并上传数据-云淘科技

详情页1

本文以创建表bank_data和result_table为例,为您介绍如何通过DataWorks创建表并上传数据。

前提条件

您在工作空间配置页面添加MaxCompute计算引擎实例后,当前页面才会显示MaxCompute目录。详情请参见创建并管理工作空间。

背景信息

表bank_data用于存储业务数据,表result_table用于存储数据分析后产生的结果。

创建表bank_data

  1. 进入数据开发页面。

    登录DataWorks控制台,单击左侧导航栏的数据建模与开发 > 数据开发,在下拉框中选择对应工作空间后单击进入数据开发

  2. 数据开发页面,鼠标悬停至阿里云大数据开发治理平台 DataWorks建表并上传数据-云淘科技图标,单击新建表 > MaxCompute > 阿里云大数据开发治理平台 DataWorks建表并上传数据-云淘科技

    您也可以打开相应的业务流程,右键单击MaxCompute,选择新建表

  3. 新建表对话框中,选择相应的路径,输入名称为bank_data,单击新建

    重要

    如果绑定多个实例,则需要选择MaxCompute引擎实例。

  4. 在表的编辑页面,单击DDL

  5. DDL对话框中,输入如下建表语句,单击生成表结构

    CREATE TABLE IF NOT EXISTS bank_data
    (
     age             BIGINT COMMENT '年龄',
     job             STRING COMMENT '工作类型',
     marital         STRING COMMENT '婚否',
     education       STRING COMMENT '教育程度',
     default         STRING COMMENT '是否有信用卡',
     housing         STRING COMMENT '房贷',
     loan            STRING COMMENT '贷款',
     contact         STRING COMMENT '联系途径',
     month           STRING COMMENT '月份',
     day_of_week     STRING COMMENT '星期几',
     duration        STRING COMMENT '持续时间',
     campaign        BIGINT COMMENT '本次活动联系的次数',
     pdays           DOUBLE COMMENT '与上一次联系的时间间隔',
     previous        DOUBLE COMMENT '之前与客户联系的次数',
     poutcome        STRING COMMENT '之前市场活动的结果',
     emp_var_rate    DOUBLE COMMENT '就业变化速率',
     cons_price_idx  DOUBLE COMMENT '消费者物价指数',
     cons_conf_idx   DOUBLE COMMENT '消费者信心指数',
     euribor3m       DOUBLE COMMENT '欧元存款利率',
     nr_employed     DOUBLE COMMENT '职工人数',
     y               BIGINT COMMENT '是否有定期存款'
    );

    创建表的更多SQL语法请参见创建表。

  6. 确认操作对话框中,单击确认

  7. 生成表结构后,在基本属性模块输入表的中文名,并分别单击提交到开发环境提交到生产环境

    说明

    本示例以标准模式的工作空间为例。如果您使用的是简单模式的工作空间,仅单击提交到生产环境即可。

  8. 在左侧导航栏,单击表管理

  9. 表管理页面,双击打开相应的表名,查看表信息。

创建表result_table

  1. 数据开发页面,鼠标悬停至阿里云大数据开发治理平台 DataWorks建表并上传数据-云淘科技图标,单击新建表 >

    您也可以打开相应的业务流程,右键单击MaxCompute,选择新建表。

  2. 新建表对话框中,选择相应的路径,输入表名为result_table,单击新建

  3. DDL模式对话框中,输入如下建表语句,单击生成表结构

    CREATE TABLE IF NOT EXISTS result_table
    (  
     education   STRING COMMENT '教育程度',
     num         BIGINT COMMENT '人数'
    );
  4. 确认操作对话框中,单击确认

  5. 生成表结构后,在基本属性区域输入表的中文名,并分别单击提交到开发环境提交到生产环境

  6. 在左侧导航栏,单击表管理

  7. 表管理页面,双击打开相应的表名,查看表信息。

本地数据上传至bank_data

DataWorks支持以下操作:

  • 上传本地的文本文件至工作空间的表中。

  • 通过数据集成模块,从多个不同的数据源导入业务数据至工作空间。

说明

本地文本文件上传的限制如下:

  • 文件类型:仅支持.txt、.csv和.log类型的文件。

  • 文件大小:不能超过30MB。

    如果您需要上传超过30MB的文件,则可以使用如下方式:

    • 将数据文件上传至OSS,使用MaxCompute外部表映射的方式获取OSS中相应的文件数据。上传数据至OSS,详情请参见上传文件,MaxCompute外部表映射,详情请参见外部表。

    • 将数据文件上传至OSS,使用数据集成功能将OSS的数据同步至MaxCompute表。上传数据至OSS,详情请参见上传文件,同步OSS数据至MaxCompute表,详情请参见通过向导模式配置离线同步任务。

    • 使用数据分析 > 数据上传功能。

  • 操作对象:支持分区表导入和非分区表导入,但不支持分区值为中文、and(&)、星号(*)等特殊字符。

以导入本地文件banking.txt至DataWorks为例,操作如下:

  1. 数据开发页面,单击阿里云大数据开发治理平台 DataWorks建表并上传数据-云淘科技图标。阿里云大数据开发治理平台 DataWorks建表并上传数据-云淘科技

  2. 数据导入向导对话框中,至少输入3个字母来搜索需要导入数据的bank_data表,单击下一步

    说明

    如果您创建表后无法在此处搜索到该表,您可以先在数据地图进行手工同步表操作后,再在此处尝试搜索该表,手工同步详情可参考文档:手工同步表。

  3. 选择数据导入方式上传本地数据,单击选择文件后的浏览…。选择本地数据文件,配置导入信息。

    阿里云大数据开发治理平台 DataWorks建表并上传数据-云淘科技

    参数

    描述

    选择数据导入方式

    默认上传本地文件

    文件格式

    您可以选择csv自定义文本文件两种格式。

    选择文件

    单击浏览…,选择本地需要上传的文件。

    选择分隔符

    包括逗号Tab分号空格|#&等分隔符,此处选择逗号

    原始字符集

    包括GBKUTF-8CP936ISO-8859,此处选择GBK

    导入起始行

    选择导入的起始行,此处选择1

    首行为标题

    根据自身需求,设置首行是否为标题。本示例无需选中首行为标题

    数据预览

    您可以在此处进行数据预览。

  4. 单击下一步

  5. 选择目标表字段与源字段的匹配方式,本示例选择按位置匹配

  6. 单击导入数据

后续步骤

现在,您已经学习了如何创建表并上传数据,您可以继续下一个教程。在该教程中,您将学习如何通过创建、配置和提交业务流程,对工作空间的数据进行深入分析和计算。详情请参见创建业务流程。

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/172533.html

(0)
上一篇 2023年12月10日 下午4:41
下一篇 2023年12月10日 下午4:42
详情页2

相关推荐

  • 阿里云云原生大数据计算服务 MaxCompute表-云淘科技

    PyODPS支持对MaxCompute表的基本操作,包括创建表、创建表的Schema、同步表更新、获取表数据、删除表、表分区操作以及如何将表转换为DataFrame对象。 背景信息 PyODPS提供对MaxCompute表的基本操作方法。 操作 说明 基本操作 列出项目空间下的所有表、判断表是否存在、获取表等基本操作。 创建表的Schema 使用PyODPS…

  • 阿里云大数据开发治理平台 DataWorks创建Hologres外部表-云淘科技

    Hologres可通过DDL方式创建Hologres外部表,也可使用DataWorks提供的可视化方式创建。本文为您介绍如何使用DataWorks可视化方式创建Hologres外部表。 前提条件 工作空间已绑定Hologres引擎。详情请参见绑定Hologres计算引擎。 创建表的用户具备开发权限角色,空间管理员或开发。授权详情请参见空间级模块权限管控。 背…

    2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云云原生大数据计算服务 MaxCompute表操作-云淘科技

    表是MaxCompute的数据存储单元。数据仓库的开发、分析及运维都需要对表数据进行处理。本文为您介绍如何创建、删除和查看表等常用表操作。 表操作常用命令如下。表操作详情请参见表操作。 类型 功能 角色 操作入口 创建表 创建非分区表或分区表。 具备项目空间创建表权限(CreateTable)的用户。 本文中的命令您可以在如下工具平台执行: MaxCompu…

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。