【发布时间】:2019-03-09 17:47:53
【问题描述】:
我有一个要求,我必须导入一个保存为 .*htm、.*html 的 .xls 文件。
我们如何将它加载到 R 中的数据框中。数据从第 5 行开始出现在 Sheet1 中。我一直在努力解决这个问题,尝试使用 xlsx 包和 readxl 包加载它。但是它们都不起作用,因为文件的本机格式不同。
我无法手动编辑文件并将其重新保存为 .xlsx,因为它无法自动化。 另请注意,将其保存为 .xlsx 文件,它工作正常。但这不是我需要的。
请帮我解决这个问题。
【问题讨论】:
-
我无法重现您的错误。这里
temp <- read_excel( "./test.html")运行良好.. Test.html 是手动重命名的 test.xlsx 文件 -
@Wimpel 我尝试在 R 中手动导入我的文件。但失败了,说 - “这是一个 excel 文件”。另外,我尝试了 read_excel,它留下了这样的消息 - read_fun 中的错误(路径 = 路径,sheet_i = 工作表,限制 = 限制,垫片 = 垫片,:无法打开
-
Excel 文件是二进制文件,而不是 HTML。
xlsx是一个包含 XML 文件的 zip 包,同样不是 HTML。也许您应该研究如何导入 HTML 表格 而不是 Excel 文件?还是导入实际的 Excel 文件? -
@Sid29 很难在没有文件本身的情况下重现...
标签: r