【问题标题】:How to make new dataframe from existing dataframe by removing duplicates from columns?如何通过从列中删除重复项从现有数据框中创建新数据框?
【发布时间】:2022-08-13 02:50:51
【问题描述】:

我有一个数据框\'merged_df\'看起来像这样:

Login ID Volume
cab001 4
cab002 3
cab001 4
cab003 2

里面有很多重复的登录ID柱子。我想制作另一个只有唯一 \'login_id\' 的数据框和每个唯一 \'login_id\' 的 \'volume\' 总和。

    标签: python pandas dataframe


    【解决方案1】:

    这会让你得到你想要的吗?

    df = pd.DataFrame({
        'login_id' : [1, 1, 2, 2, 3],
        'Volumn' : [10, 10, 20, 20, 50]
    })
    
    df_new = df.groupby('login_id', as_index = False)['Volumn'].sum().sort_values('Volumn', ascending = False)
    

    【讨论】:

    • new_df 是系列而不是数据框,您可以按体积总和对其进行排序吗?
    • 我更新了我的问题以反映我相信你的目的。这会将数据保留为数据框,并提供如何对其进行排序的选项(升序 = False 或升序 = True)
    • 感谢您理解我的问题并提供所需的解决方案。
    • 你能从df_new的前10行做一个条形图吗? X 轴 = 登录 ID,Y 轴 = 音量。
    • 我不太了解metplot或图表:/如果您需要帮助,您可以从我的代码开始并询问这些标签。我只是不想把你引向错误的方向哈哈
    猜你喜欢
    • 2022-12-28
    • 1970-01-01
    • 1970-01-01
    • 2020-11-13
    • 2021-09-08
    • 1970-01-01
    • 2023-01-30
    相关资源
    最近更新 更多