【发布时间】:2013-01-02 19:29:00
【问题描述】:
我刚刚按照以下指南:http://rogueleaderr.tumblr.com/post/32768181371/set-up-and-run-a-fully-distributed-hadoop-hbase-cluster 在 Amazon EC2 上设置了一个集群,并运行了 hadoop 和 hbase。
我现在想知道的是,我如何才能在集群上运行的 hbase 中获取我的数据?我是否需要将其加载到 S3 中,然后将其加载到我的 hbase 集群中?
是否有加载/提取数据的最佳做法?由于我是 EC2 的新手,因此任何类型的指针都会受到赞赏。
【问题讨论】:
-
您不使用 Amazon 的 Elastic MapReduce 有什么原因吗?如果您不熟悉在 AWS 上运行 Hadoop,您可能会发现使用它更容易。这是 MapReduces 的 AWS 入门指南:docs.aws.amazon.com/ElasticMapReduce/latest/GettingStartedGuide/…,这是一个有用的教程:aws.amazon.com/code/Elastic-MapReduce/2273
-
@Daan 我正在努力将我们的组代码移到亚马逊 ec2 上,我们已经拥有自己想要使用的 MapReduce 基础架构。
标签: hadoop amazon-s3 amazon-ec2 hbase