【发布时间】:2018-01-28 12:04:44
【问题描述】:
我最近在学习 Hadoop。我在 virtualbox 上使用沙盒。我下载了一个带有 mrjob 框架的 python 脚本并运行以下命令,
python RatingsBreakdown.py -r hadoop --hadoop-streaming-jar /usr/hdp/current/hadoop-mapreduce-client/hadoop-streaming-jar u.data
然后得到这个,
Running step 1 of 1...
Not a valid JAR: /usr/hdp/2.6.3.0-235/hadoop-mapreduce/hadoop-streaming-jar
【问题讨论】:
-
您没有提供实际的 jar 文件。通常以
.jar结尾,而不是-jar...请验证您提供的文件路径确实存在
标签: hadoop mapreduce hadoop-streaming mrjob