计算唯一的数据对 R答案

【问题标题】：Counting unique pairs of data R计算唯一的数据对 R
【发布时间】：2018-02-10 14:52:07
【问题描述】：

我有以下数据集

data1 = data.frame("Element" = sample(c(1:100), 600, replace = T))
data1$Factor2 = sample(c("E", "F", "G"), 600, replace = T)

我想计算与 Factor2 中的每个因素匹配的元素的数量。例如，输出可能如下表所示：

因子个数

E     45
F     67
G     34

这意味着有 45 个不同的行，例如：E,1;E11;E:20。虽然 E,1 行出现的次数更多，但我对每个组合出现了多少次不感兴趣，我感兴趣的是有多少独特的组合。

【问题讨论】：

尝试table(data1$Factor2) 最好用特定种子创建示例
summary(factor(data1$Factor2))

标签： r dataframe frequency

【解决方案1】：

dplyr 的选项

library(dplyr)
data1 %>% 
    distinct() %>% 
    count(Factor2)

【讨论】：

【解决方案2】：

您可以使用unique 来获取不同的行，然后只需创建一个表格来记录每个因素发生的次数。我正在设置种子以使数据可重现。

set.seed(2018)
data1 = data.frame("Element" = sample(c(1:100), 600, replace = T))
data1$Factor2 = sample(c("E", "F", "G"), 600, replace = T)

table(unique(data1)$Factor2)
 E  F  G 
85 92 79

【讨论】：