如何通过从列中删除重复项从现有数据框中创建新数据框？答案

【问题标题】：How to make new dataframe from existing dataframe by removing duplicates from columns?如何通过从列中删除重复项从现有数据框中创建新数据框？
【发布时间】：2022-08-13 02:50:51
【问题描述】：

我有一个数据框\'merged_df\'看起来像这样：

Login ID	Volume
cab001	4
cab002	3
cab001	4
cab003	2

里面有很多重复的登录ID柱子。我想制作另一个只有唯一 \'login_id\' 的数据框和每个唯一 \'login_id\' 的 \'volume\' 总和。

标签： python pandas dataframe

【解决方案1】：

这会让你得到你想要的吗？

df = pd.DataFrame({
    'login_id' : [1, 1, 2, 2, 3],
    'Volumn' : [10, 10, 20, 20, 50]
})

df_new = df.groupby('login_id', as_index = False)['Volumn'].sum().sort_values('Volumn', ascending = False)

【讨论】：

new_df 是系列而不是数据框，您可以按体积总和对其进行排序吗？
我更新了我的问题以反映我相信你的目的。这会将数据保留为数据框，并提供如何对其进行排序的选项（升序 = False 或升序 = True）
感谢您理解我的问题并提供所需的解决方案。
你能从df_new的前10行做一个条形图吗？ X 轴 = 登录 ID，Y 轴 = 音量。
我不太了解metplot或图表：/如果您需要帮助，您可以从我的代码开始并询问这些标签。我只是不想把你引向错误的方向哈哈