【问题标题】:Submitting Hadoop jobs through Hadoop job client on the command line在命令行通过 Hadoop 作业客户端提交 Hadoop 作业
【发布时间】:2012-09-17 09:21:02
【问题描述】:

我一直在尝试查找有关如何通过命令行提交 hadoop 作业的信息。

我知道命令-hadoop jar jar-file main-class input output

还有另一个命令,我正在尝试查找相关信息,但无法 - hadoop job -submit job-file

什么是“作业文件”,如何创建?命令 (a.) 和 (b.) 之间的基本区别是什么?哪个是更好的选择?

提前致谢。

【问题讨论】:

    标签: hadoop mapreduce


    【解决方案1】:

    这是运行 wordcount Map-reduce 作业的作业文件示例。 同样,您可以为 Map-Reduce 作业编写作业文件。

    mapred.input.dir=data/file1.txt
    mapred.output.dir=output
    mapred.job.name=wordcount
    mapred.mapper.class=edu.uci.ics.hyracks.examples.wordcount.WordCount$Map
    mapred.combiner.class=edu.uci.ics.hyracks.examples.wordcount.WordCount$Reduce
    mapred.reducer.class=edu.uci.ics.hyracks.examples.wordcount.WordCount$Reduce
    mapred.input.format.class=org.apache.hadoop.mapred.TextInputFormat
    mapred.output.format.class=org.apache.hadoop.mapred.TextOutputFormat
    mapred.mapoutput.key.class=org.apache.hadoop.io.Text
    mapred.mapoutput.value.class=org.apache.hadoop.io.IntWritable
    mapred.output.key.class=org.apache.hadoop.io.Text
    mapred.output.value.class=org.apache.hadoop.io.IntWritable
    

    对我来说,“Hadoop Jar”更好,因为在作业文件中完成的配置可以在程序本身中轻松完成。 谢谢

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2023-04-04
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多