【发布时间】:2014-02-23 01:43:05
【问题描述】:
我想让我对hadoop分布式缓存的理解更清楚。我知道当我们将文件添加到分布式缓存时,文件会加载到集群中每个节点的磁盘上。
那么文件的数据如何传输到集群中的所有节点。是通过网络吗?如果是这样,会不会对网络造成压力?
我有以下想法,对吗?
如果文件很大,会不会造成网络拥塞?
如果节点数量多,即使文件是中小型,文件的复制和传输到所有节点,会不会造成网络拥塞和内存限制?
请帮助我理解这些概念。
谢谢!!!
【问题讨论】:
标签: java hadoop mapreduce distributed-caching