【发布时间】:2016-04-25 23:31:20
【问题描述】:
我有一个旨在运行数十个 map/reduce 作业的任务。其中一些是 IO 密集型的,一些是 mapper 密集型的,一些是 reducer 密集型的。我希望能够监控当前正在使用的映射器和缩减器的数量,以便在释放一组映射器时,我可以将另一个映射器密集型作业推送到集群。我不想只是将它们堆叠在队列中,因为它们可能会阻塞映射器并且不会让 reducer 密集型的运行。
是否有我可以调用的命令行界面从(例如)Python 脚本中获取这些信息?
【问题讨论】:
-
mapper 和 reducer 是如何实现的?