【发布时间】:2015-12-11 22:22:16
【问题描述】:
给定一个 Pandas DataFrame,它具有多个具有分类值(0 或 1)的列,是否可以方便地同时获取每列的 value_counts?
例如,假设我生成一个DataFrame如下:
import numpy as np
import pandas as pd
np.random.seed(0)
df = pd.DataFrame(np.random.randint(0, 2, (10, 4)), columns=list('abcd'))
我可以得到这样的 DataFrame:
a b c d
0 0 1 1 0
1 1 1 1 1
2 1 1 1 0
3 0 1 0 0
4 0 0 0 1
5 0 1 1 0
6 0 1 1 1
7 1 0 1 0
8 1 0 1 1
9 0 1 1 0
如何方便地获取每列的值计数并方便地获取以下内容?
a b c d
0 6 3 2 6
1 4 7 8 4
我目前的解决方案是:
pieces = []
for col in df.columns:
tmp_series = df[col].value_counts()
tmp_series.name = col
pieces.append(tmp_series)
df_value_counts = pd.concat(pieces, axis=1)
但一定有更简单的方法,比如堆叠、旋转或分组?
【问题讨论】: