【发布时间】:2017-10-31 18:54:27
【问题描述】:
我正在尝试执行 python MapReduce wordcount 程序
我从writing a Hadoop MapReduce program in python 只是想了解它是如何工作的,但问题始终是 Job 不成功!
我使用Cloudera VM中的这个库执行mapper.py和reducer.py
/usr/lib/hadoop-0.20-mapreduce/contrib/streaming/hadoop-streaming-2.6.0-mr1-cdh5.12.0.jar
执行命令:
hadoop jar /usr/lib/hadoop-0.20-mapreduce/contrib/streaming/hadoop-streaming-2.6.0-mr1-cdh5.12.0.jar
-Dmaperd.reduce, tasks=1
-file wordcount/mapper.py
-mapper mapper.py -file wordcount/reducer.py
-reducer reducer.py
-input myinput/test.txt
-output output
【问题讨论】:
-
修复链接符合您的利益,以便用户可以参考它以更好地帮助您。
-
错误不在这里。查看 YARN 用户界面
-
问题出在路上,谢谢@cricket_007
-
路径呢?随时在下面发布您的解决方案作为答案,以便其他人知道该怎么做。
标签: python hadoop mapreduce cloudera word-count