【发布时间】:2013-07-25 19:29:34
【问题描述】:
我有以下应用部署
- Web 前端通过 HTTP/FTP 从客户端获取数据
- hadoop 集群
我需要将客户端的数据存储在 HDFS 上。最好的方法是什么?是否可以直接将数据流式传输到 HDFS,而无需消耗本地驱动器上来自客户端的所有数据,然后将其放入 HDFS?
【问题讨论】:
我有以下应用部署
我需要将客户端的数据存储在 HDFS 上。最好的方法是什么?是否可以直接将数据流式传输到 HDFS,而无需消耗本地驱动器上来自客户端的所有数据,然后将其放入 HDFS?
【问题讨论】:
【讨论】:
就个人而言,如果您想要低延迟访问 HDFS,最好的选择是 HBase。您可以非常轻松地放置和获取值,因为它只是一个键值存储。我们在我们的应用程序中使用了同样的东西,而且效果非常好。
【讨论】: