【发布时间】:2021-07-23 16:02:03
【问题描述】:
我希望提取第二次出现的主题 ID(他们的整行数据)或如果该行不重复,则为第一次。
这些数据来自重复访问,我们只对最近非缺失数据中的受试者感兴趣,这意味着受试者要么有“筛查”信息而没有“注射”,要么两者都有。这就是我们定义“基线”的方式。如果受试者两者都有,我们只希望保留注射的数据行(治疗前的最后数据),如果只筛选然后筛选(那是治疗前的最后数据并且将等于基线)。
这是一些数据:
df1 <- data.frame(ID = c(1, 2, 2, 3, 3, 4),
visit = c('screening', 'screening', 'injection', 'screening',
'injection', 'screening'),
var2 = c(1, 6, 3, 12, 0, 2))
我的尝试:
- 分离并重新合并包含这些主题的两个限定符的数据帧。但是当我这样做时,这些列会被重复,从而产生一个宽而不是长的数据集(当它们显然通过完全相同的 ID 匹配时)。
- 在 dplyr 中使用具有多个条件的过滤器,但它只捕获那些进行筛选的条件,因为对于重复的主题,它总是首先出现。
建议?
【问题讨论】:
标签: r