【问题标题】:How to change the size of data chunk in Hadoop?如何更改 Hadoop 中数据块的大小?
【发布时间】:2014-02-27 03:53:01
【问题描述】:

我正在使用新的 Hadoop API,由于无法明确指定映射器的数量(与旧 API 不同),我需要更改数据块的大小,以便我可以控制映射器的数量.如何在代码中更改数据拆分的默认大小?

【问题讨论】:

标签: hadoop mapreduce


【解决方案1】:

映射器的数量由(文件)拆分决定
分割大小由所使用的 InputFormat 决定。
mapred.max.split.size 参数将让您定义分割大小。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-03-28
    • 1970-01-01
    • 1970-01-01
    • 2015-08-13
    • 2017-04-18
    • 2016-12-31
    相关资源
    最近更新 更多