【发布时间】:2012-06-06 16:41:32
【问题描述】:
来自亚马逊的 EMR 常见问题:
问:我可以从 Internet 或 Amazon S3 以外的其他地方加载我的数据吗?
是的。您的 Hadoop 应用程序可以从 Internet 上的任何位置或从其他 AWS 服务加载数据。请注意,如果您从 Internet 加载数据,将收取 EC2 带宽费用。 Amazon Elastic MapReduce 还提供对 DynamoDB 中数据的基于 Hive 的访问。
从外部(非 S3)源加载数据的规范是什么?此选项似乎缺乏资源,并且似乎没有以任何形式记录。
【问题讨论】:
-
不确定我是否理解这个问题,您是说“我如何将数据从互联网加载到基于 EMR 的 Hadoop 实例中?”
-
@ChrisWhite 是的,这正是我要问的。 EMR 允许数据来自 S3 以外的地方,但没有说明如何实现。