【发布时间】:2015-07-29 07:11:18
【问题描述】:
我想在 spark 中逐行读取 xls 和 xlsx (MS Excel) 文件,就像我们对文本文件所做的那样,或者任何方式?
我想使用 spark 来提高读取大型 xls 文件(例如 1 GB)的性能,这就是为什么我需要 spark 像我们对文本文件一样读取部分文件的原因。
如何从spark中的excel文件中读取数据,无论是否逐行?
我只想使用 spark 读取 xls 文件中的条目。
请提出建议。
谢谢!!!
【问题讨论】:
标签: java hadoop apache-spark rdd spark-dataframe