【发布时间】:2015-12-08 21:57:13
【问题描述】:
在新的 Hadoop api 中,映射器的数量无法明确设置,我想将 SplitSize 更改为比默认值更小的数字,以便执行更多的映射器。如何在新的 Hadoop api 中做到这一点?
我尝试了以下方法,但它不起作用
conf.setLong(FileInputFormat.Split_MAXSIZE, 16 * 1024 * 1024)
【问题讨论】:
在新的 Hadoop api 中,映射器的数量无法明确设置,我想将 SplitSize 更改为比默认值更小的数字,以便执行更多的映射器。如何在新的 Hadoop api 中做到这一点?
我尝试了以下方法,但它不起作用
conf.setLong(FileInputFormat.Split_MAXSIZE, 16 * 1024 * 1024)
【问题讨论】:
您必须根据您的要求更改以下参数。
mapreduce.input.fileinputformat.split.minsize
和
mapreduce.input.fileinputformat.split.maxsize
查看link 了解更多详情。
【讨论】:
它是mapreduce.input.fileinputformat.split.minsize。如果它不起作用,请分享您的代码,我会看看它。
【讨论】: