【发布时间】:2014-11-06 01:49:28
【问题描述】:
Mapreduce 如何解析包含 80 列的 CSV 文件,并且对于 excel 格式的每一行,它会产生两到三行 CSV 格式的文件?在这种情况下,文本输入格式不起作用。在这种情况下键值输入格式是否有效?
【问题讨论】:
-
不明白;纠正你的语法。
Mapreduce 如何解析包含 80 列的 CSV 文件,并且对于 excel 格式的每一行,它会产生两到三行 CSV 格式的文件?在这种情况下,文本输入格式不起作用。在这种情况下键值输入格式是否有效?
【问题讨论】:
您可以编写自己的 InoutFormat 和 RecordReader,它将读取多行并作为单个记录发送到您的 Mapper。
【讨论】: