【发布时间】:2015-06-25 08:03:38
【问题描述】:
对于如何开发新的 MapReduce2 应用程序以使用 YARN 以及旧的应用程序会发生什么,我有点困惑。
我目前有 MapReduce1 应用程序,主要包括:
- 配置要提交到集群的作业的驱动程序(以前的 JobTracker 和现在的 ResourceManager)。
- 映射器 + 减速器
从一方面我看到,在 MapReduce1 中编码的应用程序在 MapReduce2 / YARN 中是兼容的,但有一些注意事项,只是使用新的 CDH5 库重新编译(我使用 Cloudera 发行版)。
但从另一方面我看到了有关以不同于 MapReduce 的方式编写 YARN 应用程序的信息(使用 YarnClient、ApplicationMaster 等):
http://hadoop.apache.org/docs/r2.7.0/hadoop-yarn/hadoop-yarn-site/WritingYarnApplications.html
但对我来说,YARN 只是架构以及集群如何管理您的 MR 应用程序。
我的问题是:
-
YARN应用程序是否包括MapReduce应用程序? - 我是否应该像
YARN应用程序那样编写代码,忘记驱动程序 并创建 Yarn 客户端,ApplicationMasters等等? - 我仍然可以使用驱动程序 + 作业设置开发客户端类吗?
MapReduce1(使用 MR2 库重新编译)作业是否由YARN管理 与 YARN 应用程序一样吗? -
MapReduce1应用程序和YARN应用程序在YARN内部管理它们的方式方面有何区别?
提前致谢
【问题讨论】:
标签: mapreduce hadoop-yarn hadoop2