【发布时间】:2016-01-04 12:33:54
【问题描述】:
我正在使用 Scalding,我们有大约 5.5GB 的输出文件大小。 (例如,对于 30 个减速器,有 30 个 5.5GB 文件)。有没有办法说,将输出文件限制为每个 512MB?我可以增加 reducer 的数量,但希望能更有活力。
【问题讨论】:
-
AFAIK 无法限制减速器中的文件大小,因此减速器的数量似乎是要走的路。您能否再解释一下为什么需要限制文件大小?
我正在使用 Scalding,我们有大约 5.5GB 的输出文件大小。 (例如,对于 30 个减速器,有 30 个 5.5GB 文件)。有没有办法说,将输出文件限制为每个 512MB?我可以增加 reducer 的数量,但希望能更有活力。
【问题讨论】:
我不确定 Scalding,但在典型的 map reduce 中,您可以通过实现多种输出格式来增加输出文件的数量。您可以根据键生成文件名前缀(默认使用部分作为前缀)。
【讨论】: