【发布时间】:2020-05-11 18:31:26
【问题描述】:
我有一个包含这些列的数据框:一个包含日期 (YYYY-MM-DD),一个包含年份(YYYY 为数字形式),一个包含个人 ID,其他包含特征。
我想过滤掉个人,以便仅保留在日期之前至少有 10 次观察和在日期之后有 5 次观察的人(最少总数为 15),其余的被过滤掉。按日期或年份过滤都可以。
你能想出什么方法来做到这一点,它不包括我与原始数据帧进行比较的大量新数据帧 - 以加快进程吗?
【问题讨论】:
-
您能否展示一个具有预期输出的可重现的小示例,以便其他人可以测试
-
编写一个适用于个人的函数,并使用
tapply或dplyr::filter一次性将其应用于所有个人。