【发布时间】:2016-11-24 09:12:34
【问题描述】:
我想知道如何使用 R 脚本将位于 hdfs 中的 .xlsx 文件转换为 .csv 文件。
我尝试使用 XLConnect 和 xlsx 包,但它给了我错误“找不到文件”。我使用上述包在 R 脚本中提供 HDFS 位置作为输入。我能够使用 R 从 hdfs 读取 .csv 文件脚本(read.csv())。
我是否需要安装任何新包来读取 hdfs 中存在的 .xlsx。
分享我使用的代码:
library(XLConnect)
d1=readWorksheetFromFile(file='hadoop fs -cat hdfs://............../filename.xlsx', sheet=1)
“错误:FileNotFoundException (Java):找不到文件 'filename.xlsx' - 如果文件不存在,您可以指定自动创建。”
我确定该文件存在于指定位置。
希望我的问题很清楚。请提出解决方法。
提前致谢!
【问题讨论】:
-
欢迎来到 *!请阅读有关how to ask a good question 以及如何提供reproducible example 的信息。这将使其他人更容易帮助您。
-
错误很明显。您没有以正确的方式引用该文件。