【发布时间】:2012-07-01 04:21:39
【问题描述】:
我有一个DataFrame,其中的列如下:
["A_1", "A_2", "A_3", "B_1", "B_2", "B_3"]
我想将各个 A 列和 B 列“折叠”在一个列中并计算它们的平均值。简而言之,在操作结束时,我会得到:
["A", "B"]
其中“A”是所有“A”列的按列平均值,“B”是所有“B”列的平均值。
据我了解,groupby 不适合此任务,或者我使用不正确:
grouped = data.groupby([item for item in data if "A" not in item])
如果我使用axis=1,我在调用mean() 时得到的只是一个空的DataFrame,如果不是,我就得不到想要的效果。我想避免构建一个单独的 DataFrame 以通过迭代填充手段(例如,通过分别计算手段然后像new_df["A"] = mean_a 一样添加它们)。有没有有效的解决方案?
【问题讨论】: