【发布时间】:2015-03-02 18:23:11
【问题描述】:
我正在尝试在 hadoop 集群上运行 Dumbo MapReduce 命令,但出现以下错误。
15/03/02 17:55:28 错误流。StreamJob:作业不成功。错误:不适用 2002 年 15 月 3 日 17:55:28 信息流。StreamJob:killJob... 流式传输命令失败!
看来我需要提供 Hadoop 流 jar 的路径。 我怎样才能找到这个以及 Hadoop 流 jar 是什么?
我的dumbo命令如下:
dumbo start test_dumbo6.py -hadoop /apps/hadoop/ -input /storage/user/jj/json.log -output ipcounts2
【问题讨论】: