详情页标题前

阿里云云原生大数据计算服务 MaxCompute使用限制-云淘科技

详情页1

本文对MapReduce使用限制项进行说明,不遵循使用限制可能导致业务受到影响。

MaxCompute MapReduce限制项汇总,如下所示。

边界名 边界值 分类 配置项名称 默认值 是否可配置 说明
Instance内存占用 [256 MB,12 GB] 内存限制 odps.stage.mapper(reducer).memodps.stage.mapper(reducer).jvm.mem 2048 MB+1024 MB 单个Map Instance或Reduce Instance占用Memory,有框架Memory(默认2048 MB)和JVM的Heap Memory(默认1024
MB)两部分。
Resource数量 256个 数量限制 单个Job引用的Resource数量不超过256个,Table、Archive按照一个单位计算。
输入路数和输出路数 1024个和256个 数量限制 单个Job的输入路数不能超过1024(同一个表的一个分区算一路输入,总的不同表个数不能超过64个),单个Job的输出路数不能超过256。
Counter数量 64个 数量限制 单个Job中自定义Counter的数量不能超过64,Counter的Group Name和Counter Name中不能带有井号(#),两者长度和不能超过100。
Map Instance [1,100000] 数量限制 odps.stage.mapper.num 单个Job的Map Instance个数由框架根据Split Size计算得出,如果没有输入表,可以通过odps.stage.mapper.num直接设置,最终个数范围[1,100000]。
Reduce Instance [0,2000] 数量限制 odps.stage.reducer.num 单个Job默认Reduce Instance个数为Map Instance个数的1/4,用户设置作为最终的Reduce Instance个数,范围[0,2000]。可能出现这样的情形:Reduce处理的数据量会比Map大很多倍,导致Reduce阶段比较慢,而Reduce只能最多2000。
重试次数 3 数量限制 单个Map Instance或Reduce Instance失败重试次数为3,一些不可重试的异常会直接导致作业失败。
Local Debug模式 Instance个数不超100 数量限制 Local Debug模式下:

  • 默认Map Instance个数为2,不能超过100。
  • 默认Reduce Instance个数为1,不能超过100。
  • 默认一路输入下载记录数100,不能超过10000。
重复读取Resource次数 64次 数量限制 单个Map Instance或Reduce Instance重复读一个Resource次数限制<=64次。
Resource字节数 2 GB 长度限制 单个Job引用的Resource总计字节数大小不超过2 GB。
Split Size 大于等于1 长度限制 odps.stage.mapper.split.size 256 MB 框架会参考设置的Split Size值来划分Map,决定Map的个数。
STRING列内容长度 8 MB 长度限制 MaxCompute表STRING列内容长度不允许超出限制。
Worker运行超时时间 [1,3600] 时间限制 odps.function.timeout 600 Map或者Reduce Worker在无数据读写且没有通过context.progress()主动发送心跳的情况下的超时时间,默认值是600s。
MapReduce引用Table资源支持的字段类型 BIGINT、DOUBLE、STRING、DATETIME、BOOLEAN 数据类型限制 MapReduce任务引用表资源时,若表字段有其他类型字段执行报错。
MapReduce是否支持读取OSS数据 功能限制 MapReduce不支持读取OSS数据。
MapReduce是否支持MaxCompute 2.0新类型 功能限制 MapReduce不支持MaxCompute 2.0新类型。

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/159370.html

(0)
上一篇 2023年12月10日 上午1:42
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云云原生大数据计算服务 MaxComputeMaxCompute+DLF+OSS实践-云淘科技

    由于DLF中数据入湖功能已经停止更新,本文采用DataWorks数据集成的入湖方式,以MySQL数据入湖为例,为您介绍在MaxCompute中如何创建外部项目,并查询DLF中的表数据。 MySQL数据入湖 DLF入湖详情请参见快速入门。 步骤一:创建数据湖的元数据库 登录数据湖管理控制台,在页面上方选择地域,在元数据 > 元数据管理页面创建元数据库。具…

    2023年12月10日
  • 阿里云云原生大数据计算服务 MaxCompute存储成本优化-云淘科技

    本文从数据分区、表生命周期和定期删除表3个方面为您介绍如何优化存储成本。 对于存储优化而言,有三个关键点: 合理地进行数据分区。 设置合理的表生命周期。 定期地删除废表。 合理设置数据分区 MaxCompute将分区列的每个值作为一个分区。您可以指定多级分区,即将表的多个字段作为表的分区,分区之间的关系类似多级目录的关系。在使用数据时如果指定了需要访问的分区…

  • 阿里云人工智能平台PAI特征重要性过滤-云淘科技

    特征重要性过滤组件为线性特征重要性、GBDT特征重要性和随机森林特征重要性等组件提供过滤功能,支持过滤TopN的特征。 组件配置 PAI命令 PAI -name fe_filter_runner -project algo_public -DselectedCols=pdays,previous,emp_var_rate,cons_price_idx,con…

    阿里云人工智能平台PAI 2023年12月10日
  • 阿里云云原生大数据计算服务 MaxCompute表概述-云淘科技

    本文为您介绍表的基本概念、数据类型和使用限制。 系统架构 您可以通过如下系统架构图了解MaxCompute数据的处理流程。 MaxCompute中表的类型如下。 基本概念项目项目(Project)是MaxCompute的基本组织单元,类似于传统数据库的Database或Schema。项目是进行多用户隔离和访问控制的主要边界。一个用户可以同时拥有多个项目的权限…

    2023年12月10日
  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云对象存储OSS哪些因素会影响清单导出速度?-云淘科技

    清单的导出速度仅与待导出的Object数量有关,与Object的大小和导出周期无关。 当Object数量较多时(例如超出100亿),受限于清单导出速度,不建议以天为单位导出清单,否则可能会因任务的堆积,影响导出速度。 内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家阿里云企业补贴进行中: 马上申请腾讯云限时活动1折起,即将结束: 马上收藏同尘科技…

    阿里云对象存储 2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。