【发布时间】:2016-09-03 10:45:51
【问题描述】:
在名称为“keys”的列中创建包含一些重复单元格值的 DataFrame 后:
import pandas as pd
df = pd.DataFrame({'keys': [1,2,2,3,3,3,3],'values':[1,2,3,4,5,6,7]})
我继续创建另外两个 DataFrame,它们是原始 DataFrame df 的合并版本。那些新创建的 DataFrame 在“keys”列下将没有重复的单元格值:
df_sum = df_a.groupby('keys', axis=0).sum().reset_index()
df_mean = df_b.groupby('keys', axis=0).mean().reset_index()
如您所见,df_sum['values'] 单元格的值全部加在一起。
而df_mean['values'] 单元格值是使用mean() 方法平均的。
最后,我将两个数据框中的“值”列重命名为:
df_sum.columns = ['keys', 'sums']
df_mean.columns = ['keys', 'means']
现在我想将df_mean['means'] 列复制到数据框df_sum。
如何做到这一点?
下面的 Photoshop 图像说明了我想要创建的数据框。 'sums' 和 'means' 列都合并到一个 DataFrame 中:
【问题讨论】: