详情页标题前

阿里云云原生大数据计算服务 MaxCompute快速入门-云淘科技

详情页1

PyODPS可在DataWorks等数据开发平台中作为数据开发节点调用。这些平台提供了PyODPS运行环境和调度执行的能力,无需您手动创建ODPS入口对象。PyODPS支持类似Pandas的快速、灵活和富有表现力的数据结构。您可以通过PyODPS提供的DataFrame API使用Pandas的数据结果处理功能。本文以DataWorks平台为例,帮助您快速开始使用PyODPS,并且能够用于实际项目。

前提条件

  • 已开通MaxCompute服务,详情请参见开通MaxCompute。

  • 已开通DataWorks服务,并创建工作空间,详情请参见创建MaxCompute项目。

操作步骤

  1. 新建PyODPS节点。

    为方便您快速开始,本文中使用DataWorks PyODPS节点进行开发,详情请参见创建PyODPS 3节点。

    说明

    • 以PyODPS 3节点作为示例,PyODPS 3节点底层的Python版本为3.7。

    • PyODPS节点获取本地处理的数据量不能超过50 MB,节点运行时占用的内存不能超过1 GB,否则节点任务会被系统中止。因此请避免在PyODPS任务中写入数据量较大的Python处理代码。

    • 在DataWorks上编写代码并进行调试效率较低,为提升运行效率,建议本地安装IDEA进行代码开发。

    1. 新建业务流程。

      进入数据开发页面,右键单击业务流程,选择新建业务流程

    2. 新建PyODPS节点。

      右键单击新建的业务流程,选择新建节点 > MaxCompute > PyODPS 3,输入节点名称,单击提交

  2. 编辑PyODPS节点。

    1. 编写程序代码。

      在PyODPS节点的编辑框中输入测试代码。以下是一个完整的使用PyODPS接口执行表操作的示例,更多关于表操作以及SQL操作的方法请参见表和SQL。

      from odps import ODPS
      
      #以直接指定字段名以及字段类型的方式创建非分区表my_new_table。
      #DataWorks的PyODPS节点中默认包含一个全局变量odps或者o,即为ODPS入口。您不需要手动定义ODPS入口,直接使用即可。更多信息,请参见通过DataWorks使用PyODPS。
      table = o.create_table('my_new_table', 'num bigint, id string', if_not_exists=True)
      
      #向非分区表my_new_table中插入数据。
      records = [[111, 'aaa'],
                [222, 'bbb'],
                [333, 'ccc'],
                [444, '中文']]
      o.write_table(table, records)
      
      #读取非分区表my_new_table中的数据。
      for record in o.read_table(table):
          print(record[0],record[1])
      
      #以运行SQL的方式读取表中的数据。
      result = o.execute_sql('select * from my_new_table;',hints={'odps.sql.allow.fullscan': 'true'})
      
      #读取SQL执行结果。
      with result.open_reader() as reader:    
          for record in reader:            
              print(record[0],record[1])
      
      #删除表以清除资源。
      table.drop()
    2. 运行代码。

      完成编辑后,单击阿里云云原生大数据计算服务 MaxCompute快速入门-云淘科技图标。运行结束后,您可以在下方的运行日志中看到运行结果。输出如下日志代表执行成功。阿里云云原生大数据计算服务 MaxCompute快速入门-云淘科技

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/159559.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云人工智能平台PAI读MaxCompute表-云淘科技

    本文介绍如何使用PyODPS和SQL File读MaxCompute表数据。 前提条件 在开始执行操作前,请确认您已经完成以下准备工作: 已开通MaxCompute,详情请参见开通MaxCompute。 可选:已创建支持登录PAI控制台的RAM角色,详情请参见RAM角色登录并使用PAI。 可选:已为RAM角色授权MaxCompute项目操作权限,详情请参见通…

    2023年12月10日
  • 阿里云容器服务ACKTerraform概述-云淘科技

    Terraform是一种开源工具,用于安全高效地预览,配置和管理云基础架构和资源。本文介绍Terraform的基本概念、使用优势和应用场景。 基本概念 Terraform是一个云上资源编排工具,实现基础设施即代码。 Terraform能够让您在阿里云上轻松使用简单模板语言定义、预览和部署云基础架构。更多信息,请参见Configuration Syntax。 …

    阿里云容器服务 2023年12月10日
  • 阿里云云原生大数据计算服务 MaxCompute通过DataWorks使用PyODPS-云淘科技

    PyODPS为MaxCompute的Python版SDK,支持在DataWorks中开发运行PyODPS任务。本文为您介绍在DataWorks上使用PyODPS的使用限制、主要流程和部分简单应用示例。 使用限制 使用方式限制 如果您发现有Got killed报错,即表明内存使用超限,进程被中止。请避免在PyODPS节点中直接下载数据并在DataWorks中处…

  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云云原生大数据计算服务 MaxComputePyODPS API概述-云淘科技

    本文为您提供了PyODPS API文档链接,其中包含各函数的参数说明及示例。 ODPS详解(Definitions) PyODPS DataFrame指南(DataFrame Reference) 内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家阿里云企业补贴进行中: 马上申请腾讯云限时活动1折起,即将结束: 马上收藏同尘科技为腾讯云授权服务中心…

  • 阿里云日志服务SLS日志审计服务概述-云淘科技

    本文介绍日志审计服务的功能特性、背景信息、应用场景、技术优势及覆盖的云产品。 产品试用 SLS Playground中的日志审计服务Demo,内置了演示数据、可视化图表等资源,提供了完整的演示环境,便于您快速了解及体验功能。 您可以单击日志审计服务,进行试用。 重要 SLS Playground中的数据为演示数据,请勿用于生产环境。 功能特性 日志审计服务在…

    阿里云日志服务SLS 2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。