【发布时间】:2018-02-01 12:01:34
【问题描述】:
在数据集 (N=6000) 中,我想分析(15 个虚拟)变量组合出现的频率。
ID Var1 Var2 Var3 Var15
1 1 0 0 1
2 0 1 1 1
3 1 0 0 0
6000 1 0 0 0
对于这个例子,我希望看到组合 1000 出现两次,1001 出现一次,0111 也出现一次。
我能想到的唯一方法是为每个可能的组合计算一个变量...
有没有一种优雅而有效的方法来做到这一点?
我已通读 How to summarize all possible combinations of variables? 但这是一个稍微不同的问题,Aggregating Tally counters 超越了我的知识范围(但如果这是我问题的答案,我会解决的)。
【问题讨论】: