【发布时间】:2014-10-31 02:16:48
【问题描述】:
每次在 R 中处理 excel 文件时,我仍然很痛苦。
执行以下操作的最佳方法是什么?
1- 将 R 中的 excel 作为“整个工作簿”导入并能够在工作簿中的任何工作表中进行分析?如果您考虑使用XLConnect,请记住Java 的“内存不足”问题。我有超过 30MB 的文件,每次处理 Java 内存问题都会消耗更多时间。 (运行-Xmx 对我不起作用)。
2- 不要错过任何 Excel 表格中的任何数据?将文件保存到csv 表示某些工作表“超出范围”,即 65,536 行和 256 列。它也不能处理一些公式。
3- 不必单独导入每张纸吗?将工作表导入 SPSS、STATA 或 Eviews 并将其保存到其扩展名中,然后在 R 中使用输出文件在大多数情况下都可以正常工作。但是,这种方法有两个主要问题;一个是您必须在机器上下载软件,另一个是它一次只导入一张纸。如果我有超过 30 张纸,那将变得非常耗时。
这可能是一个已被多次回答的持续问题,但是,每个答案都解决了问题的一部分,而不是整个问题。这就像放火而不是战略性地解决问题。
我使用的是带有 R 3.1.1 的 Mac OS 10.10
【问题讨论】:
-
显然战略解决方案是完全停止使用 Excel。继续,你知道你想要。
-
因为答案取决于许多变量,您需要尝试各种可能性。这是一个列表:web.archive.org/web/20131109195709/http://rwiki.sciviews.org/…
-
@Andrie 我希望我可以。问题是我正在使用一些数据库,并且数据集仅在 excel 中可用。我希望他们在分析数据时看到有多少人因 excel 而受苦,并提供一种替代方法。
-
您在使用
.xlsx文件吗?还是旧的.xls文件? -
伙计...我感觉到你的痛苦。 Excel 应该用作分析过程的最后一步,但人们认为它是一个该死的数据库。如果您在从某人那里获取数据时遇到问题,而他们最终将其发送到一个 excel 文件中,那么您现在有两个问题。