【问题标题】:MIT StarCluster and S3MIT StarCluster 和 S3
【发布时间】:2015-07-11 21:16:33
【问题描述】:

我正在尝试在现场实例上运行 mapreduce 作业。 我使用 StarClusters 及其 hadoop 插件启动我的实例。我上传数据没有问题,然后将其放入 HDFS,然后将结果从 HDFS 复制回来。 我的问题是有没有办法直接从 s3 加载数据并将结果推回 s3? (我不想手动将数据从 s3 下载到 HDFS 并将结果从 HDFS 推送到 s3,有没有办法在后台这样做)?

我使用的是标准的 MIT 星团 ami

【问题讨论】:

    标签: hadoop amazon-web-services amazon-ec2 amazon-s3 starcluster


    【解决方案1】:

    你不能这样做,但你可以编写一个脚本来做到这一点。 例如,您可以使用: hadoop distcp s3n://ID:key@mybucket/file /user/root/file 将文件从 s3 直接放到 hdfs

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多