【发布时间】:2015-10-26 06:35:44
【问题描述】:
我有一个包含两列(字符)的数据集 - 文本,源,我想创建一个数据集,这样如果文本列中的特定值出现少于 5 次。我正在使用下面的代码,但它只给出第一次出现,而不是我需要满足该条件的所有观察结果。例如: 'iphone' 在 text 中出现了 4 次,所以我需要所有 4 个观察结果及其相应的来源,但我只得到一个观察结果。
test = sqldf('select * , count(*) as count from base group by text having count < 5')
我熟悉 SAS 中的 proc sql,最近开始学习 R。sqldf 的工作方式是否不同?
【问题讨论】: