【问题标题】:Importing .xls file that is saved as *.htm, *.html as it is saved on the backend导入保存为 *.htm、*.html 的 .xls 文件,因为它保存在后端
【发布时间】:2019-03-09 17:47:53
【问题描述】:

我有一个要求,我必须导入一个保存为 .*htm、.*html 的 .xls 文件。

我们如何将它加载到 R 中的数据框中。数据从第 5 行开始出现在 Sheet1 中。我一直在努力解决这个问题,尝试使用 xlsx 包和 readxl 包加载它。但是它们都不起作用,因为文件的本机格式不同。

我无法手动编辑文件并将其重新保存为 .xlsx,因为它无法自动化。 另请注意,将其保存为 .xlsx 文件,它工作正常。但这不是我需要的。

请帮我解决这个问题。

【问题讨论】:

  • 我无法重现您的错误。这里temp <- read_excel( "./test.html") 运行良好.. Test.html 是手动重命名的 test.xlsx 文件
  • @Wimpel 我尝试在 R 中手动导入我的文件。但失败了,说 - “这是一个 excel 文件”。另外,我尝试了 read_excel,它留下了这样的消息 - read_fun 中的错误(路径 = 路径,sheet_i = 工作表,限制 = 限制,垫片 = 垫片,:无法打开
  • Excel 文件是二进制文件,而不是 HTML。 xlsx 是一个包含 XML 文件的 zip 包,同样不是 HTML。也许您应该研究如何导入 HTML 表格 而不是 Excel 文件?还是导入实际的 Excel 文件?
  • @Sid29 很难在没有文件本身的情况下重现...

标签: r


【解决方案1】:

试试openxlsx 包及其函数read.xlsx。如果这不起作用,您可以按照例如here 的描述以编程方式重命名文件,然后使用这些 excel 包之一打开它。

您的文件可能是 xls 格式而不是 xlsx,您是否尝试过 readxl 中的 read_xls() 函数?或者它也可以是文本格式,在这种情况下 read.table()fread() 来自 data.table 应该可以工作。将文件保存为 xlsx 后它可以工作的事实强烈表明它一开始没有格式化为 xlsx。

希望这会有所帮助。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-04-28
    相关资源
    最近更新 更多