【问题标题】:Convert xlsx file to csv file in R when xlsx file is present in hdfs当 hdfs 中存在 xlsx 文件时,将 xlsx 文件转换为 R 中的 csv 文件
【发布时间】:2016-11-24 09:12:34
【问题描述】:

我想知道如何使用 R 脚本将位于 hdfs 中的 .xlsx 文件转换为 .csv 文件。

我尝试使用 XLConnect 和 xlsx 包,但它给了我错误“找不到文件”。我使用上述包在 R 脚本中提供 HDFS 位置作为输入。我能够使用 R 从 hdfs 读取 .csv 文件脚本(read.csv())。

我是否需要安装任何新包来读取 hdfs 中存在的 .xlsx。

分享我使用的代码:

library(XLConnect)

d1=readWorksheetFromFile(file='hadoop fs -cat hdfs://............../filename.xlsx', sheet=1)

“错误:FileNotFoundException (Java):找不到文件 'filename.xlsx' - 如果文件不存在,您可以指定自动创建。”

我确定该文件存在于指定位置。

希望我的问题很清楚。请提出解决方法。

提前致谢!

【问题讨论】:

标签: r hadoop


【解决方案1】:

hadoop fs 不是文件,而是将文件从 HDFS 复制到本地文件系统的 命令。从 R 外部(或使用 system 从 R 内部)运行此命令,然后打开电子表格。

【讨论】:

    最近更新 更多