【发布时间】:2015-03-04 09:22:05
【问题描述】:
假设我有两个变量和 213005 个观察值的数据框,它看起来像这样:
df <- data.frame(nr=c(233, 233, 232, 231, 234, 234, 205),
date=c("2012/01/02", "2012/01/01", "2012/01/01", "2012/01/02", "2012/01/01", "2012/01/01", "2012/01/05"))
我需要根据“日期”值为每个不同的“nr”值创建一个名为“new”的新列,它应该如下所示:
df <- data.frame(nr=c(233, 233, 232, 231, 234, 234, 205),
date=c("2012/01/02", "2012/01/01", "2012/01/01", "2012/01/02",
"2012/01/01", "2012/01/01", "2012/01/05"),
new=c(1, 2, 3, 4, 5, 5, 6))
(nr=233,日期=2012/01/02)=>(新=1)
(nr=233, date=2012/01/01) => (new=2) ...
对于 (nr=234, date=2012/01/01) 应该有两个相同的列,new=5,重复的行应该留在数据框中。
有人知道怎么做吗?任何帮助将不胜感激! 谢谢!
【问题讨论】:
-
@Nemo 链接的“骗子”与这个问题无关。
-
@Nemo 可能的重复项是stackoverflow.com/questions/13018696/…,但链接中的问题又是针对 data.table 的,所以我不知道是否可以将其作为重复项关闭
-
@akrun 你选择关闭它与否,我只是搜索和学习 :-) 感谢你在这里提供的惊人帮助 akrun :-)
-
@Nemo 没问题。如果我们得到更好的链接,我会保持打开状态