【发布时间】:2019-03-08 13:35:54
【问题描述】:
我已经将一些原始数据导入到 R 中,如下所示:
表1:
ID Year Value
01 1999 25
01 2000 12
01 2002 14
02 1998 16
02 2003 0
02 2004 14
该表按 ID 和年份排序,但如您所见,缺少一些年份。我从数据来源知道这些缺失年份的价值应该为零。我有另一个变量,我称之为 MODEL_YEAR,并设置为 2015。我想填补空白,包括 MODEL_YEAR。
我认为我会采取的步骤是:
- 为表 1 中的每个 ID 选择最早的年份。
- 构建一个新表(Table2),其中包含从每个 ID 的最早年份到 MODEL_YEAR 的连续年份。
- 将 Table1 连接到 Table2 以重新添加值,并将任何 NA 值替换为零。
我认为我可以完成第 1 步和第 3 步,但无法弄清楚如何进行第 2 步,即构建 Table2。
如果您认为我的方法不是最佳的,我们将不胜感激任何帮助或替代方法的建议。
谢谢
【问题讨论】:
-
如果我没记错的话,您想使用
2015作为去年,但第一个呢? -
第一个因 ID 而异 - 这就是为什么在第 1 步中我想为每个 ID 选择第一年。
标签: r data-manipulation