【发布时间】:2014-12-26 08:03:44
【问题描述】:
我有以下pandas.DataFrame:
val1 val2 val3 val4
1 7 8 3 2
2 1 4 5 4
3 5 7 5 3
4 7 8 3 2
5 6 8 1 0
6 0 2 5 7
7 1 4 5 4
8 7 8 3 2
我想计算我的 DataFrame 中每个元组的数量。预期结果(或多或少):
count tuple
3 (7, 8, 3, 2)
2 (1, 4, 5, 4)
1 (5, 7, 5, 3)
1 (6, 8, 1, 0)
1 (0, 2, 5, 7)
还要注意,我真正的 DataFrame 有 数百万个条目,所以我确实需要一些时间优化的解决方案。
直到现在,我的方法是用Series.astype(str) 转换字符串列中的每一列,然后连接这些列,并使用pandas.Series.value_counts()。但我认为可能有一种更快、更自然的方法来解决我的问题。谁能赐教?
【问题讨论】:
标签: python pandas count tuples