详情页标题前

阿里云云原生大数据计算服务 MaxComputeMapReduce作业提交-云淘科技

详情页1

本文向您介绍如何使用Jar命令在MaxCompute客户端运行和提交MapReduce作业。

MaxCompute客户端提供Jar命令用于运行MapReduce作业,举例如下。

jar -conf \home\admin\myconf -resources a.txt,example.jar -classpath ..\lib\example.jar:.\other_lib.jar -D java.library.path=.
ative;

语法介绍

jar [] 
[ARGS]; -conf Specify an application configuration file -resources file able resources used in mapper or reducer, seperate by comma -classpath classpaths used to run mainClass -D = Property value pair, which will be used to run mainClass -l Run job in local mode

参数说明

包括(均为可选参数):

  • -conf :指定JobConf配置文件。该文件可以影响SDK中JobConf的设置。

    JobConf配置文件的模板如下。

    
           
              import.filename
              resource.txt
           
                  

    在上述模板中,通过JobConf配置文件定义一个名为import.filename的变量,该变量的值为resource.txt

    您可以在MapReduce程序中通过JobConf接口获取该变量的值。通过SDK中JobConf接口您可以达到相同的目的,详情请参见资源使用示例 。

    示例如下。

    add jar data\mapreduce-examples.jar;
        jar -resources mapreduce-examples.jar -classpath data\mapreduce-examples.jar
            org.alidata.odps.mr.examples.WordCount wc_in wc_out;
        add file data\src.txt;
        add jar data\mapreduce-examples.jar;
        jar -resources src.txt,mapreduce-examples.jar -classpath data\mapreduce-examples.jar
            org.alidata.odps.mr.examples.WordCount wc_in wc_out;
        add file data\a.txt;
        add table wc_in as test_table;
        add jar data\work.jar;
        jar -conf odps-mapred.xml -resources a.txt,test_table,work.jar
            -classpath data\work.jar:otherlib.jar
            -D import.filename=resource.txt org.alidata.odps.mr.examples.WordCount args;
  • -resources :MapReduce作业运行时使用的资源声明。一般情况下,resource_name_list中需要指定Map/Reduce函数所用的资源名称。


    说明

    • 如果在Map/Reduce函数中读取了其他MaxCompute资源,则这些资源名称也需要被添加到resource_name_list中。
    • 资源之间使用逗号分隔,使用跨项目空间使用资源时,需要前面加上PROJECT/resources/。例如,-resources otherproject/resources/resfile
    • 在Map/Reduce函数中读取资源的示例,请参见资源使用示例。
  • -classpath本地执行时的classpath,主要用于指定main函数所在的Jar包的本地路径(包含相对路径和绝对路径)。

    包名之间使用系统默认的文件分割符作分割。通常情况下,Windows系统中使用分号(;),Linux系统中使用逗号(,)。如果您在云端服务器运行MapReduce任务,则使用逗号(,)进行分隔。


    说明 通常,您可能更习惯于将main函数与Map/Reduce函数编写在一个包中,例如WordCount 代码示例。因此,在执行示例程序时,-resources及-classpath的参数中都出现了mapreduce-examples.jar。但二者意义不同,-resources引用的是Map/Reduce函数,运行于分布式环境中。而-classpath引用的是main函数,运行于本地,指定的Jar包路径也是本地文件路径。

  • -D =:本地执行时,的Java属性,可以定义多个。
  • -l:以本地模式执行MapReduce作业,主要用于程序调试。

内容没看懂? 不太想学习?想快速解决? 有偿解决: 联系专家

阿里云企业补贴进行中: 马上申请

腾讯云限时活动1折起,即将结束: 马上收藏

同尘科技为腾讯云授权服务中心。

购买腾讯云产品享受折上折,更有现金返利:同意关联,立享优惠

转转请注明出处:https://www.yunxiaoer.com/159393.html

(0)
上一篇 2023年12月10日
下一篇 2023年12月10日
详情页2

相关推荐

  • 阿里云对象存储OSSCDN加速和OSS传输加速的区别-云淘科技

    概述 本文主要介绍阿里云对象存储OSS的传输加速功能和CDN加速OSS资源的区别,以便您根据实际业务进行选择。 详细信息 阿里云对象存储OSS以海量、安全、低成本、高可靠等特点已经成为用户存储静态资源和文件的首要选择,实际使用中面向全球各地用户访问OSS资源时,访问速度会受到客户端网络、OSS的下行带宽、Bucket地域、访问链路长等限制出现访问慢的情况。以…

    阿里云对象存储 2023年12月10日
  • 阿里云大数据开发治理平台 DataWorks使用内建函数-云淘科技

    函数列表页面为您展示MaxCompute系统自带的函数,您可以在该页面查看函数的分类、说明和示例。 背景信息 为了供您方便快捷的使用MaxCompute SQL进行数据分析和数据加工,MaxCompute提供了丰富的内建函数,以便您在日常开发和分析中使用,对于内建函数,您无需关注函数内部的实现逻辑,可直接进行调用。您可以根据需要从不同维度快速查询目标函数。 …

  • 信息流广告,信息流部分建议宽度830px,只针对默认列表样式,顺序随机
  • 阿里云ECS云服务器初始化小于等于2 TiB数据盘(Windows)-云淘科技

    一块全新的Windows数据盘挂载到ECS实例后,还不能直接存储数据,通常您需要完成磁盘联机、新建分区、格式化等初始化操作后,才能供系统读写数据。本文介绍如何在Windows系统中初始化一块小于等于2 TiB的数据盘。 前提条件 数据盘已挂载到ECS实例。具体操作,请参见挂载数据盘。 背景信息 本文示例中使用的配置如下所示,您需要根据实际情况进行操作。 操作…

    2023年12月9日
  • 阿里云RDS数据库DescribeDBInstanceHAConfig – 查询RDS实例高可用模式和数据复制方式-云淘科技

    该接口用于查询RDS实例的高可用模式和数据复制方式。 接口说明 适用引擎 RDS MySQL RDS PostgreSQL RDS SQL Server 相关功能文档 注意 使用该接口前,请仔细阅读功能文档,确保完全了解使用接口的前提条件及使用后造成的影响后,再进行操作。 RDS MySQL查询数据复制方式 RDS PostgreSQL查询数据复制方式 RD…

    阿里云数据库 2023年12月9日
  • 阿里云日志服务SLSParquet格式-云淘科技

    日志服务将日志投递到OSS后,支持存储为不同的文件格式。本文介绍Parquet格式。 参数配置 在创建OSS投递任务(新版)时,选择存储格式为parquet,对应的参数配置如下所示。 相关参数说明如下表所示。 参数 说明 Key名称 您可以在原始日志页签中查看日志字段,将需要投递到OSS的字段名有序填入。OSS投递任务将按照此顺序组织Parquet数据,并使…

    2023年12月10日

联系我们

400-800-8888

在线咨询: QQ交谈

邮件:admin@example.com

工作时间:周一至周五,9:30-18:30,节假日休息

关注微信
本站为广大会员提供阿里云、腾讯云、华为云、百度云等一线大厂的购买,续费优惠,保证底价,买贵退差。