【问题标题】:Counting unique pairs of data R计算唯一的数据对 R
【发布时间】:2018-02-10 14:52:07
【问题描述】:

我有以下数据集

data1 = data.frame("Element" = sample(c(1:100), 600, replace = T))
data1$Factor2 = sample(c("E", "F", "G"), 600, replace = T)

我想计算与 Factor2 中的每个因素匹配的元素的数量。 例如,输出可能如下表所示:

因子个数

E     45
F     67
G     34

这意味着有 45 个不同的行,例如:E,1;E11;E:20。虽然 E,1 行出现的次数更多,但我对每个组合出现了多少次不感兴趣,我感兴趣的是有多少独特的组合。

【问题讨论】:

  • 尝试table(data1$Factor2) 最好用特定种子创建示例
  • summary(factor(data1$Factor2))

标签: r dataframe frequency


【解决方案1】:

dplyr 的选项

library(dplyr)
data1 %>% 
    distinct() %>% 
    count(Factor2)

【讨论】:

    【解决方案2】:

    您可以使用unique 来获取不同的行,然后只需创建一个表格来记录每个因素发生的次数。我正在设置种子以使数据可重现。

    set.seed(2018)
    data1 = data.frame("Element" = sample(c(1:100), 600, replace = T))
    data1$Factor2 = sample(c("E", "F", "G"), 600, replace = T)
    
    table(unique(data1)$Factor2)
     E  F  G 
    85 92 79 
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2011-11-24
      • 1970-01-01
      相关资源
      最近更新 更多