【发布时间】:2021-11-08 09:16:06
【问题描述】:
我有 Hortonworks Sandbox 并运行了命令:
ssh root@127.0.0.1 -p 2222;
登录后,我想在位于 Documents 下的 2 个 HDFS 文件 RatinsBreakdown.py 和 u.data 上运行 MapReduce,就像我在这里所做的那样:
python RatingsBreakdown.py -r hadoop hdfs:///user/[username]/u.data --hadoop-streaming-jar /usr/hdp/2.6.2.0-205/hadoop-mapreduce/hadoop-streaming.jar
如何调整上面的命令以在 Hadoop 集群中运行?
[root@sandbox ~]#
【问题讨论】:
标签: python hadoop mapreduce hortonworks-sandbox