【发布时间】:2016-02-15 06:34:22
【问题描述】:
我想在数据帧的变量中执行线性插值,其中考虑到:1)两点之间的时间差,2)获取数据的时刻和 3)被测量的个体变量。
例如在下一个数据帧中:
df <- data.frame(time=c(1,2,3,4,5,6,7,1,2,3),
Individuals=c(1,1,1,1,1,1,1,2,2,2),
Value=c(1, 2, 3, NA, 5, NA, 7, 5, NA, 7))
df
我想获得:
result <- data.frame(time=c(1,2,3,4,5,6,7,1,2,3),
Individuals=c(1,1,1,1,1,1,1,2,2,2),
Value=c(1, 2, 3, 4, 5, 6, 7, 5, 5.5, 6))
result
我不能只使用包na.approx 的函数zoo,因为所有观察都不是连续的,一些观察属于一个人,而其他观察属于其他人。原因是因为如果第二个人对NA 进行第一次观察并且我将专门使用函数na.approx,我将使用来自individual==1 的信息来插入NA 的individual==2(例如下一个数据帧会有这样的错误)
df_2 <- data.frame(time=c(1,2,3,4,5,6,7,1,2,3),
Individuals=c(1,1,1,1,1,1,1,2,2,2),
Value=c(1, 2, 3, NA, 5, NA, 7, NA, 5, 7))
df_2
我尝试过使用 zoo 和 dplyr 包:
library(dplyr)
library(zoo)
proof <- df %>%
group_by(Individuals) %>%
na.approx(df$Value)
但我无法在 zoo 对象中执行 group_by。
您知道如何按组在一个变量中插入NA 值吗?
提前致谢,
【问题讨论】:
-
您能否详细说明一下您想要的输出是什么?此外,您正在尝试的“Ear_tag”分组是什么。您提供的数据框中不存在此列?
标签: r group-by dplyr zoo linear-interpolation