【发布时间】:2013-02-23 17:11:00
【问题描述】:
如何在 Hadoop mapreduce 中处理负载平衡?我正在编写一个分布式应用程序,其中服务器根据基准测试、可用内存、CPU 内核数量、CPU 使用率、可用 GPU 数量/使用情况将作业分配给工作节点?我对 mapreduce 不是很有经验,并且已经阅读了 apache 网站上的一些文档,但仍然不确定如何解决这个问题。我可以进行基准计算并获取所有这些信息,然后通过算法动态拆分输入吗?
谢谢!
【问题讨论】:
-
我认为这个链接可能会有所帮助:bradhedlund.com/2011/09/10/…
-
感谢您提供了有关 mapreduce 的非常丰富的信息,但我们不会处理大量数据本身,文章仅提及平衡存储。我想知道我是否可以根据从节点的功能动态平衡负载:将运行的基准测试、CPU 速度/内核数/CPU 使用率、GPU 数/使用率、可用主内存。跨度>
标签: java apache hadoop mapreduce distributed