【发布时间】:2017-10-10 19:20:35
【问题描述】:
我在 *.csv 中有数据集,例如
a ,b
1 ,2
3 ,4
5 ,2
事实上,这是一个非常大(超过 500,000 条记录)的数据集,其中 a 为 unix 时间,b 为名称。我需要建立一个散点图,我决定在一段时间内将重复的名字计数超过 10 次,并在它们上建立一个图表。但是当我尝试
library(ggplot2)
library(plyr)
compl <- ddply(num.csv,.(b),nrow)
) 那么我在表中只有两列,并且我丢失了时间列。如何在表格中创建一个新列并在名称可重复的条件下构建图表?
这就是我的期望
a ,b ,repeatsOfB
1 ,2 ,2
3 ,4 ,1
5 ,2 ,2
并在重复次数> 10 的行上绘制一个
【问题讨论】: