【问题标题】:column names on grouped DataFrame output to CSV分组 DataFrame 输出到 CSV 的列名
【发布时间】:2012-08-19 11:40:27
【问题描述】:

我有一个来自大型调查问卷的dataFrame,我正在通过聚合不同轴上的数据来生成摘要:

df.groupby(group_name).agg([np.mean, np.std, np.count_nonzero])

这会在我的问卷中生成一个包含平均值、标准差和计数的列。分组 dataFrame 中每一列的名称是一个元组 (original_column_name, function_applied)

问题是,当我输出到 CSV(使用to_csv())时,列名作为元组输出,即('gender', 'mean'), ('gender', 'std'),理想情况下我想要gender_meangender_std 之类的东西

如何在输出到 CSV 之前处理这些列名?

【问题讨论】:

    标签: python csv pandas


    【解决方案1】:

    在 pandas 0.8.1 中,试试这个:

    group_df = df.groupby(group_name).agg([np.mean, np.std, np.count_nonzero])
    group_df.rename(None, lambda coltuple: '_'.join(coltuple), False, True)
    

    更多详情请见the DataFrame documentation

    【讨论】:

    • 太棒了,这行得通。注意:有一个小错字(lambda)购买所以不允许我将其编辑为小
    • 糟糕,blub blubity blub。 :-)
    猜你喜欢
    • 2013-06-12
    • 2019-07-14
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-06-20
    • 2021-11-23
    相关资源
    最近更新 更多