【问题标题】:submitting hadoop-streaming jobs: yarn or hadoop?提交hadoop-streaming作业:yarn还是hadoop?
【发布时间】:2016-01-11 01:45:23
【问题描述】:

使用yarn jar 命令和使用hadoop jar 命令提交hadoop-streaming 作业有什么区别?

这是来自current documentation

hadoop jar hadoop-streaming-2.7.1.jar \
  -D mapreduce.job.reduces=2 \
  -input myInputDirs \
  -output myOutputDir \
  -mapper /bin/cat \
  -reducer /usr/bin/wc

但是这个命令也可以用:

yarn jar hadoop-streaming-2.7.1.jar \
  -D mapreduce.job.reduces=2 \
  -input myInputDirs \
  -output myOutputDir \
  -mapper /bin/cat \
  -reducer /usr/bin/wc

如果这两个命令是等价的(我认为它们是等价的),哪个是首选,为什么?

【问题讨论】:

标签: hadoop hadoop-yarn hadoop-streaming


【解决方案1】:

如果您的 MapReduce 框架是 YARN,它们是相等的。如果没有,hadoop jar 将使用 MRv1 运行您的 jar 文件,yarn jar 将使用 YARN(MRv2) 运行您的 jar。

【讨论】:

  • 感谢有道理。谢谢。
  • 我以为它会自动切换到 YARN。感谢您指出这一点!
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2015-05-23
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2019-07-13
  • 2017-10-16
  • 1970-01-01
相关资源
最近更新 更多