详情页标题前

阿里云人工智能平台PAIMTable聚合-云淘科技

详情页1

组件将Table按照分组聚合成MTable。

使用限制

支持的计算引擎为MaxCompute和Flink。

可视化配置组件参数

  • 输入桩

    输入桩(从左到右)

    数据类型

    建议上游组件

    是否必

    数据

    • 读数据表

    • 特征工程

    • 数据预处理

  • 组件参数

    页签

    参数

    描述

    字段设置

    选择的列

    计算列对应的列名列表。

    分组列名数组

    分组列名,多列,可选,默认不选,代表全量数据聚合。

    参数设置

    输出结果列列名

    输出结果列列名。

    执行调优

    节点个数

    单个节点内存大小参数配对使用。取值为[1, 9999]的正整数。

    单个节点内存大小,单位M

    取值范围为1024 MB~64*1024 MB。

通过代码方式配置组件

您可以将以下代码复制到PyAlink脚本组件中,使PyAlink脚本组件实现与该组件相同的功能。

import numpy as np
import pandas as pd
from pyalink.alink import *

df_data = pd.DataFrame([
      ["a1", "11L", 2.2],
      ["a1", "12L", 2.0],
      ["a2", "11L", 2.0],
      ["a2", "12L", 2.0],
      ["a3", "12L", 2.0],
      ["a3", "13L", 2.0],
      ["a4", "13L", 2.0],
      ["a4", "14L", 2.0],
      ["a5", "14L", 2.0],
      ["a5", "15L", 2.0],
      ["a6", "15L", 2.0],
      ["a6", "16L", 2.0]
])

input = BatchOperator.fromDataframe(df_data, schemaStr='id string, f0 string, f1 double')

zip = GroupByBatchOp()\
	.setGroupByPredicate("id")\
	.setSelectClause("id, mtable_agg(f0, f1) as m_table_col")

flatten = FlattenMTableBatchOp()\
	.setReservedCols(["id"])\
	.setSelectedCol("m_table_col")\
	.setSchemaStr('f0 string, f1 int')

zip.linkFrom(input).link(flatten).print()

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/162912.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云RDS数据库ModifyDBProxyEndpoint – 修改数据库独享代理的代理终端-云淘科技

    该接口用于修改RDS实例数据库独享代理的代理终端配置。 接口说明 适用引擎 RDS MySQL RDS PostgreSQL 相关功能文档 注意 使用该接口前,请仔细阅读功能文档,确保完全了解使用接口的前提条件及使用后造成的影响后,再进行操作。 RDS MySQL开通并配置数据库代理服务 RDS PostgreSQL新增数据库代理终端 调试 您可以在Open…

    阿里云数据库 2023年12月9日
  • 阿里云RDS数据库实时性能-云淘科技

    数据库自治服务DAS为RDS PostgreSQL提供实时性能功能,可以实时查看数据库实例性能。本文介绍如何使用实时性能功能。 前提条件 RDS PostgreSQL数据库实例为高可用版。 操作步骤 访问RDS实例列表,在上方选择地域,然后单击目标实例ID。 在左侧导航栏中,选择自治服务 > 一键诊断。 单击实时性能页签。 在实时性能页面中,支持两种视…

    2023年12月9日
  • 阿里云RDS数据库不同阿里云账号下RDS实例间的数据同步-云淘科技

    数据传输服务DTS(Data Transmission Service)支持对不同阿里云账号下的RDS MySQL实例(含RDS MySQL Serverless)配置数据同步,实现跨阿里云账号的数据同步。 前提条件 源RDS实例和目标RDS实例的数据库类型为RDS MySQL。 目标RDS MySQL实例的存储空间须大于源RDS MySQL实例占用的存储空…

    2023年12月9日
  • 阿里云RDS数据库恢复方案概览-云淘科技

    本文介绍RDS SQL Server的恢复方案概览。 场景 功能 相关操作 数据恢复 恢复到已有实例 恢复SQL Server数据说明 恢复单库到已有实例时,建议先手动备份单库,再将单库备份的作为数据库恢复的起始点,在应用的版本升级或发布等场景下,该方式可更灵活回滚数据。 恢复到全新实例 通过临时实例恢复到原实例说明 临时实例恢复到原实例仅适用于RDS SQ…

    阿里云数据库 2023年12月9日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云大数据开发治理平台 DataWorksListDataServiceFolders-云淘科技

    调用ListDataServiceFolders查询数据服务文件夹列表。 调试 您可以在OpenAPI Explorer中直接运行该接口,免去您计算签名的困扰。运行成功后,OpenAPI Explorer可以自动生成SDK代码示例。 请求参数 名称 类型 是否必选 示例值 描述 Action String 是 ListDataServiceFolders 系…

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。