【发布时间】:2016-11-11 06:14:15
【问题描述】:
我的 map reduce 作业依赖于第三方库,例如 hive-hcatalog-xxx.jar。我正在通过 oozie 运行我所有的工作。 Mapreduce 作业通过 java 操作运行。在我的工作中包含第三方库的最佳方式是什么?我手头有两个选择
将所有依赖的 jar 打包到主 jar 中,并创建一个 fat jar。
将所有依赖 jar 保存在 HDFS 位置并通过 -libjars 选项添加
我可以选择哪一个?请指教。
由于我的 mapreduce 作业是通过 oozie 的 java 操作调用的,因此 oozie lib 文件夹中可用的库不会添加到 mapper/reducer 的类路径中。如果我将此 java 操作更改为映射 reduce 操作,jar 是否可用?
提前致谢。
【问题讨论】:
标签: hadoop jar mapreduce oozie