【发布时间】:2015-01-16 22:45:48
【问题描述】:
我知道这是一个非常简单的问题,但我一直无法找到答案。
我有一个数据框,可以为您提供一个人的 ID 和他的爱好。由于一个人可能有很多爱好,因此 id 字段可能会在多行中重复,每行都有不同的爱好。我一直在尝试只打印那些有多个爱好的行。我能够使用 table 获得频率。
但是如何应用条件仅在频率大于一时才打印。
其次,有没有更好的方法来查找频率而不使用表格。
这是我对没有过滤器的表的尝试,频率大于一
> id=c(1,2,2,3,2,4,3,1)
> hobby = c('play','swim','play','movies','golf','basketball','playstation','gameboy')
> df = data.frame(id, hobby)
> table(df$id)
1 2 3 4
2 3 2 1
【问题讨论】:
-
tbl <- table(df$id); tbl[tbl > 1] -
您是否要过滤数据?还是频率表?
-
谢谢@RichardScriven,我会继续的。只是补充一下,有没有一种方法可以在没有频率的情况下单独在数据框中获取 id?
-
表在哪些方面不满足你
标签: r