【发布时间】:2019-03-14 09:53:56
【问题描述】:
下面是我目前拥有的一个较短的数据框。它由重复的 ID 号、购买该物品的月份以及该物品是什么组成:
id <- c('100','100','200','200','300','300','300','300')
month <- c(1,1,6,8,1,1,4,7)
purchase <- c('Apple','Apple','Banana','Orange','Apple','Apple','Pear','Melon')
df <- data.frame(id,month,purchase)
我正在尝试使用聚合函数来连接此数据框,以便提取个人进行的第一次和第二次购买。
我想退回这样的东西
id combined purchase
100 [(1,'Apple'),(1,'Apple')]
200 [(6,'Banana'),(8,'Orange')]
300 [(1,'Apple'),(1,'Apple'),(4,'Pear'),(7,'Melon')]
我可以相应地编制索引。
可能有更简单的方法可以做到这一点,但我不确定。我将不胜感激任何反馈和帮助。谢谢!
【问题讨论】:
-
I can extract the first and second purchase the individual makes.为什么id300 有 4 个条目?那是什么数据结构? -
有些人的购买次数超过 2 次。我(目前)担心前两个。
标签: r concatenation aggregation