【发布时间】:2015-12-16 23:20:10
【问题描述】:
我是 R 新手;有一个简单的绊脚石,我一直在寻找答案。
Dateframe 包含一份个人列表,其中包含他们在五年内的表现。分析需要仅包括最近一年参与的那些个人,因此我需要识别这些个人,然后从原始数据框中选择所有列的个人的所有记录(还有 50 个或更多其他列)。
原始数据帧是performance_fiveyr;我正在使用的变量是 person_id 和 year。我已经尝试了许多可能的方法来获得我需要的东西;我在这里列出了其中一种方式......
第一步是创建过去一年参与的个人列表
person_current <- subset (x = performance_fiveyr,
subset = year==2015, # keep only records from 2015
select = person_id # keep only the person_id variable
)
下一步是从 performance_fiveyr 中选择 person_id 存在于 person_current 中的所有行,并返回所有其他列(总共超过 50 列)。
performance_current <- performance_fiveyr[performance_fiveyr$person_id
%in% person_current, ]
我已经尝试了不止几种变体,结果要么全列无行,要么全行无变量。
【问题讨论】:
标签: r