分组 DataFrame 输出到 CSV 的列名答案

【问题标题】：column names on grouped DataFrame output to CSV分组 DataFrame 输出到 CSV 的列名
【发布时间】：2012-08-19 11:40:27
【问题描述】：

我有一个来自大型调查问卷的dataFrame，我正在通过聚合不同轴上的数据来生成摘要：

df.groupby(group_name).agg([np.mean, np.std, np.count_nonzero])

这会在我的问卷中生成一个包含平均值、标准差和计数的列。分组 dataFrame 中每一列的名称是一个元组 (original_column_name, function_applied)

问题是，当我输出到 CSV（使用to_csv()）时，列名作为元组输出，即('gender', 'mean'), ('gender', 'std')，理想情况下我想要gender_mean 和gender_std 之类的东西

如何在输出到 CSV 之前处理这些列名？

【问题讨论】：

【解决方案1】：

在 pandas 0.8.1 中，试试这个：

group_df = df.groupby(group_name).agg([np.mean, np.std, np.count_nonzero])
group_df.rename(None, lambda coltuple: '_'.join(coltuple), False, True)

【讨论】：