【发布时间】:2011-08-23 18:40:41
【问题描述】:
我经常发现自己不得不在 R 中执行重复性任务。不得不一遍又一遍地在一个或多个数据结构上不断地运行相同的函数会让人非常沮丧。
例如,假设我在 R 中有三个单独的数据帧,我想删除每个数据帧中具有缺失值的行。对于三个数据帧,在每个 df 上运行 na.omit() 并不是那么困难,但它会变得非常低效 当一个人有一百个相似的数据结构需要相同的操作时。
df1 <- data.frame(Region=c("Asia","Africa","Europe","N.America","S.America",NA),
variable=c(2004,2004,2004,2004,2004,2004), value=c(35,20,20,50,30,NA))
df2 <- data.frame(Region=c("Asia","Africa","Europe","N.America","S.America",NA),
variable=c(2005,2005,2005,2005,2005,2005), value=c(55,350,40,90,99,NA))
df3 <- data.frame(Region=c("Asia","Africa","Europe","N.America","S.America",NA),
variable=c(2006,2006,2006,2006,2006,2006), value=c(300,200,200,500,300,NA))
tot04 <- na.omit(df1)
tot05 <- na.omit(df2)
tot06 <- na.omit(df3)
在 R 中处理重复性任务有哪些一般准则?
是的,我知道这个问题的答案是特定于一个人所面临的任务,但我只是询问用户在执行重复性任务时应该考虑的一般事项。
【问题讨论】: