【发布时间】:2016-05-29 12:24:45
【问题描述】:
我收到了数百张包含合并单元格的 Excel 表格。发件人坚持使用 Excel 和合并单元格——对此我无能为力。我如何使用 R 阅读这些内容?例如,输入表问题区域的简化版本可能如下所示,其中合并的单元格(B2、B3、C2、C3)包含单词“X”。合并单元格的数量及其在工作表中的位置(以及“X”的值)因工作表而异,并且同一工作表中可能有多个合并单元格。工作表实际上不是表格格式,它们包含其他空单元格。我已经成功地遍历了所有文件,清理了整个混乱,重塑了结果并获得了一个整洁的数据集(1 张而不是 736 个 Excel 工作簿)。问题是,到目前为止,我的解决方案忽略了合并单元格中的信息。
A B C D
1 a f i l
2 b X m
3 c n
4 d g j o
5 e h k p
如何将 Excel 工作表读入 R 中,使结果看起来像这样,带有单词“X”
A B C D
1 a f i l
2 b X X m
3 c X X n
4 d g j o
5 e h k p
【问题讨论】:
-
可能是this 会有所帮助
-
Excel VBA 最擅长处理 Excel 数据。您可以编写一个 VBA 宏来取消合并单元格、复制内容、将文件保存为 csv 文件、通过该宏运行文件,然后在 R 中打开它们。
-
这项正在进行的工作与此处相关:github.com/rsheets/rexcel/blob/master/README.md
-
如何确定合并区域是 B2:C3 而不是两个合并区域: B2:C2 和 A3:C3 ?这可能很难自动检测到。