【发布时间】:2020-07-21 09:56:28
【问题描述】:
我想根据逗号分隔的一列取平均值,并在另一列上取平均值。
我的文件如下所示:
ColumnA ColumnB
A, B, C 2.9
A, C 9.087
D 6.78
B, D, C 5.49
我的输出应该是这样的:
A 7.4435
B 5.645
C 5.83
D 6.135
我的代码是这样的:
df = pd.DataFrame(data.ColumnA.str.split(',', expand=True).stack(), columns= ['ColumnA'])
df = df.reset_index(drop = True)
df_avg = pd.DataFrame(df.groupby(by = ['ColumnA'])['ColumnB'].mean())
df_avg = df_avg.reset_index()
它必须大致相同,但无法弄清楚。
【问题讨论】: