【发布时间】:2016-09-16 16:21:29
【问题描述】:
下面的内容让我有点抓狂,我相信有一个简单的解决方案。
我目前使用 R 从一堆 excel 文件中执行一些计算,这些文件是每月对财务数据的观察。这些文件都具有完全相同的列标题。每个文件都被导入,对其进行一些计算,并将输出保存到一个列表中。导入下一个文件并重复该过程。我为此使用以下代码:
filelist <- list.files(pattern = "\\.xls")
universe_list <- list()
count <- 1
for (file in filelist) {
df <- read.xlsx(file, 1, startRow=2, header=TRUE)
*perform calcs*
universe_list[[count]] <- df
count <- count + 1
}
我现在遇到一个问题,我想要执行的一些新操作会涉及来自两个或多个 Excel 文件的数据。例如,我需要导入 Jan-16 和 Jan-15 的 Excel 文件,执行需要完成的任何操作,然后继续执行下一组文件(Feb-16 和 Feb-15)。这些文件的长度总是固定的(比如一年等)
我似乎无法弄清楚如何执行此操作的代码……从流程的角度来看,我在想 1)需要设计一个循环来同时导入两组文件,2)从导入的文件中创建两个数据框数据,3)重命名数据框之一的列(以便可以区分列),4)将两个数据框合并在一起,以及 4)执行计算。我无法为此计算出步骤 1-4 的代码!
非常感谢您的帮助
【问题讨论】:
标签: r loops import merge rename