【发布时间】:2016-03-10 09:23:15
【问题描述】:
编辑: 下面是非常有用的,所以我已经玩了几个小时了。最终,我尝试了一些不起作用的方法:从每个 id 的点数的平均值来看,我尝试只包括每个 id 的最后(例如)5 次点击/浏览量。我使用的代码是:
megest
但是,它只会生成一个如下所示的表格:
id points
1 c(20,0)
2 c(20,10,20,100,20)
而不是将它们相加并产生平均值。我很好奇,有没有办法解决这个问题?提前致谢! (并为这个问题中的许多新问题道歉,但 R 让我非常兴奋)。
各位经验丰富的 R 用户,
我是 R 新手,所以如果答案是直截了当的或者我不清楚,我深表歉意。
我创建了一个数据框,其中包含 16 个变量的大约 500,000 次点击流数据观察。其中两列是“id”和“assigned points”
其中“id”表示互联网会话 id,“points”表示我为每次点击/浏览量分配的点数(可能是某些点击没有分配点数),例如:
id points
1 10
1 N/A
1 30
2 100
3 20
3 10
在“id”列中,大约有 60000 个唯一值。我想要实现的是,计算分配给每个“id”的点数,并让 R 自动为所有唯一 id 执行此操作。所以我正在寻找这样的结果:
1 [40], 2 [100], 3[30]
但是,我完全不知道如何告诉 R 识别所有唯一 ID 并在所有这些唯一 ID 中做某事(即计数点)。
所有帮助将不胜感激!提前致谢!
【问题讨论】:
-
申请
sum,另见rowsum(data$points, data$id, na.rm = TRUE)
标签: r