【发布时间】:2014-08-16 08:46:16
【问题描述】:
我想知道是否可以根据文件数量来判断使用的映射器/减速器的数量(默认情况下)?
我知道映射器的数量取决于块大小而不是实际文件大小,但我想确定我是否遗漏了那里的任何东西。
例如:
如果hdfs中有4个目录,其中有4个文件。
dir1/file1 - contains (testing file 1, testing again)
dir2/file2 - contains (testing file 2, testing again)
dir3/file3 - contains (testing file 3, testing again)
dir4/file4 - contains (testing file 4, testing again)
有没有办法知道需要多少个mapper和reducer来处理以上四个文件?
【问题讨论】: