详情页标题前

阿里云云原生大数据计算服务 MaxCompute使用限制-云淘科技

2023年12月10日上午1:42 • 阿里云大数据计算服务MaxCompute

详情页1

本文对MapReduce使用限制项进行说明，不遵循使用限制可能导致业务受到影响。

MaxCompute MapReduce限制项汇总，如下表所示。


边界名	边界值	分类	配置项名称	默认值	是否可配置	说明
Instance内存占用	[256 MB,12 GB]	内存限制	`odps.stage.mapper(reducer).mem`和`odps.stage.mapper(reducer).jvm.mem`	2048 MB＋1024 MB	是	单个Map Instance或Reduce Instance占用Memory，有框架Memory（默认2048 MB）和JVM的Heap Memory（默认1024 MB）两部分。
Resource数量	256个	数量限制	–	无	否	单个Job引用的Resource数量不超过256个，Table、Archive按照一个单位计算。
输入路数和输出路数	1024个和256个	数量限制	–	无	否	单个Job的输入路数不能超过1024（同一个表的一个分区算一路输入，总的不同表个数不能超过64个），单个Job的输出路数不能超过256。
Counter数量	64个	数量限制	–	无	否	单个Job中自定义Counter的数量不能超过64，Counter的Group Name和Counter Name中不能带有井号（#），两者长度和不能超过100。
Map Instance	[1,100000]	数量限制	odps.stage.mapper.num	无	是	单个Job的Map Instance个数由框架根据Split Size计算得出，如果没有输入表，可以通过odps.stage.mapper.num直接设置，最终个数范围[1,100000]。
Reduce Instance	[0,2000]	数量限制	odps.stage.reducer.num	无	是	单个Job默认Reduce Instance个数为Map Instance个数的1/4，用户设置作为最终的Reduce Instance个数，范围[0,2000]。可能出现这样的情形：Reduce处理的数据量会比Map大很多倍，导致Reduce阶段比较慢，而Reduce只能最多2000。
重试次数	3	数量限制	–	无	否	单个Map Instance或Reduce Instance失败重试次数为3，一些不可重试的异常会直接导致作业失败。
Local Debug模式	Instance个数不超100	数量限制	–	无	否	Local Debug模式下：默认Map Instance个数为2，不能超过100。默认Reduce Instance个数为1，不能超过100。默认一路输入下载记录数100，不能超过10000。
重复读取Resource次数	64次	数量限制	–	无	否	单个Map Instance或Reduce Instance重复读一个Resource次数限制<=64次。
Resource字节数	2 GB	长度限制	–	无	否	单个Job引用的Resource总计字节数大小不超过2 GB。
Split Size	大于等于1	长度限制	odps.stage.mapper.split.size	256 MB	是	框架会参考设置的Split Size值来划分Map，决定Map的个数。
STRING列内容长度	8 MB	长度限制	–	无	否	MaxCompute表STRING列内容长度不允许超出限制。
Worker运行超时时间	[1,3600]	时间限制	odps.function.timeout	600	是	Map或者Reduce Worker在无数据读写且没有通过`context.progress()`主动发送心跳的情况下的超时时间，默认值是600s。
MapReduce引用Table资源支持的字段类型	BIGINT、DOUBLE、STRING、DATETIME、BOOLEAN	数据类型限制	–	无	否	MapReduce任务引用表资源时，若表字段有其他类型字段执行报错。
MapReduce是否支持读取OSS数据	–	功能限制	–	无	否	MapReduce不支持读取OSS数据。
MapReduce是否支持MaxCompute 2.0新类型	–	功能限制	–	无	否	MapReduce不支持MaxCompute 2.0新类型。

内容没看懂？不太想学习？想快速解决？有偿解决：联系专家

阿里云企业补贴进行中：马上申请

腾讯云限时活动1折起，即将结束：马上收藏

 同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折，更有现金返利:同意关联，立享优惠

转转请注明出处：https://www.yunxiaoer.com/159370.html

instance map MapReduce Reduce 数量表限制

赞 (0)

0

阿里云云原生大数据计算服务 MaxComputeMaxCompute项目设置RAM子账号为超级管理员-云淘科技

上一篇 2023年12月10日上午1:42

阿里云云原生大数据计算服务 MaxCompute快速入门-云淘科技

下一篇 2023年12月10日

详情页2

阿里云大数据计算服务MaxCompute

阿里云云原生大数据计算服务 MaxComputeMaxCompute+DLF+OSS实践-云淘科技

由于DLF中数据入湖功能已经停止更新，本文采用DataWorks数据集成的入湖方式，以MySQL数据入湖为例，为您介绍在MaxCompute中如何创建外部项目，并查询DLF中的表数据。 MySQL数据入湖 DLF入湖详情请参见快速入门。步骤一：创建数据湖的元数据库登录数据湖管理控制台，在页面上方选择地域，在元数据 > 元数据管理页面创建元数据库。具…

2023年12月10日
0
阿里云云原生大数据计算服务 MaxCompute存储成本优化-云淘科技

本文从数据分区、表生命周期和定期删除表3个方面为您介绍如何优化存储成本。对于存储优化而言，有三个关键点：合理地进行数据分区。设置合理的表生命周期。定期地删除废表。合理设置数据分区 MaxCompute将分区列的每个值作为一个分区。您可以指定多级分区，即将表的多个字段作为表的分区，分区之间的关系类似多级目录的关系。在使用数据时如果指定了需要访问的分区…

阿里云大数据计算服务MaxCompute 2023年12月10日
0
阿里云人工智能平台PAI特征重要性过滤-云淘科技

特征重要性过滤组件为线性特征重要性、GBDT特征重要性和随机森林特征重要性等组件提供过滤功能，支持过滤TopN的特征。组件配置 PAI命令 PAI -name fe_filter_runner -project algo_public -DselectedCols=pdays,previous,emp_var_rate,cons_price_idx,con…

阿里云人工智能平台PAI 2023年12月10日
0
阿里云大数据计算服务MaxCompute

阿里云云原生大数据计算服务 MaxCompute表概述-云淘科技

本文为您介绍表的基本概念、数据类型和使用限制。系统架构您可以通过如下系统架构图了解MaxCompute数据的处理流程。 MaxCompute中表的类型如下。基本概念项目项目（Project）是MaxCompute的基本组织单元，类似于传统数据库的Database或Schema。项目是进行多用户隔离和访问控制的主要边界。一个用户可以同时拥有多个项目的权限…

2023年12月10日
0
信息流广告，信息流部分建议宽度830px，只针对默认列表样式，顺序随机
阿里云对象存储OSS哪些因素会影响清单导出速度？-云淘科技

清单的导出速度仅与待导出的Object数量有关，与Object的大小和导出周期无关。当Object数量较多时（例如超出100亿），受限于清单导出速度，不建议以天为单位导出清单，否则可能会因任务的堆积，影响导出速度。内容没看懂？不太想学习？想快速解决？有偿解决：联系专家阿里云企业补贴进行中：马上申请腾讯云限时活动1折起，即将结束：马上收藏同尘科技…

阿里云对象存储 2023年12月10日
0

联系我们

400-800-8888

在线咨询： QQ交谈

邮件：admin@example.com

工作时间：周一至周五，9:30-18:30，节假日休息

关注微信

本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买，续费优惠，保证底价，买贵退差。