【发布时间】:2014-02-27 03:53:01
【问题描述】:
我正在使用新的 Hadoop API,由于无法明确指定映射器的数量(与旧 API 不同),我需要更改数据块的大小,以便我可以控制映射器的数量.如何在代码中更改数据拆分的默认大小?
【问题讨论】:
-
我认为你也不能在旧 API 中做到这一点。
我正在使用新的 Hadoop API,由于无法明确指定映射器的数量(与旧 API 不同),我需要更改数据块的大小,以便我可以控制映射器的数量.如何在代码中更改数据拆分的默认大小?
【问题讨论】:
映射器的数量由(文件)拆分决定
分割大小由所使用的 InputFormat 决定。
mapred.max.split.size 参数将让您定义分割大小。
【讨论】: