【问题标题】:How do I calculate the times each combination of variable values in a dataframe occurs?如何计算数据框中每个变量值组合发生的时间?
【发布时间】:2021-05-24 19:56:38
【问题描述】:

我可以使用 distinct() 来获取所有唯一组合的数据框,现在我想获取每个唯一组合出现的次数。我使用的实际数据框有超过 10k 的组合,所以我无法手动计算。

n=1000000
X = rbinom(size=1,n,p=0.3)
U = rbinom(size=1,n,p=0.5) 
Y = rbinom(size=1,n,p=0.1)
dat<-data.frame(X, Y, U)
distinct(dat, X, U)

【问题讨论】:

    标签: r dataframe combinations distinct-values


    【解决方案1】:

    您可以使用dplyr::count,也可以像这样查看dplyr::add_count

    dplyr::count(dat, X, U)
    # identical to
    dplyr::group_by(dat, X, U) %>% 
      dplyr::summarise(n = n())
    
    dplyr::add_count(dat, X, U)
    
    

    【讨论】:

      猜你喜欢
      • 2020-06-28
      • 2018-09-26
      • 1970-01-01
      • 2021-10-25
      • 2021-02-06
      • 2018-05-17
      • 2021-04-26
      • 2013-08-08
      • 1970-01-01
      相关资源
      最近更新 更多