【发布时间】:2017-01-26 06:02:37
【问题描述】:
我需要读取存储在 Hadoop 集群上的 excel(xls) 文件。现在我做了一些研究,发现我需要为此创建一个 custom InputFormat。我阅读了很多文章,但从编程的角度来看,它们都没有帮助。如果有人可以帮助我编写自定义输入格式的示例代码,以便我可以了解“编程输入格式”的基础知识并可以使用 Apache POI 库来读取 excel 文件。 我制作了一个 mapreduce 程序来读取文本文件。现在我需要帮助,即使我有一些方法可以编写自己的 custom InputFormat 代码,我将在哪里编写与我已经编写的 mapreduce 程序相关的代码。
PS:- 不能将 .xls 文件转换为 .csv 文件。
【问题讨论】:
-
如果您对此有任何解决方案,请分享。
标签: java excel hadoop mapreduce