【问题标题】:How to groupby by comparing two columns uisng pandas如何通过使用熊猫比较两列来分组
【发布时间】:2020-05-25 19:44:01
【问题描述】:

有一个包含列名和 exm_date 的 df

name   roll       exm_date 

tom    242    2019-03-05 11:48:03.166              
mark   244    2018-03-05 11:48:03.166                   

tom    244    2020-03-05 11:48:03.166              
mark   242    2019-03-05 11:48:03.166    

如何通过比较名称和滚动来获得最小日期。如果滚动不同,则应将其视为单独的记录

预期输出

name   roll       exm_date 

tom    242    2019-03-05 11:48:03.166              
mark   244    2018-03-05 11:48:03.166                   
tom    244    2020-03-05 11:48:03.166   

为了比较一列(名称)和我使用的日期:

df=df.groupby('name')['exm_date'].min().reset_index()

试过这个:

df=df.groupby('name','roll')['exm_date'].min().reset_index()

【问题讨论】:

    标签: python python-3.x pandas dataframe group-by


    【解决方案1】:

    groupby 子句中缺少方括号([]):

    这样做:

    df = df.groupby(['name','roll'])['exm_date'].min().reset_index()
    

    【讨论】:

      猜你喜欢
      • 2020-06-12
      • 1970-01-01
      • 1970-01-01
      • 2020-06-08
      • 2022-11-17
      • 1970-01-01
      • 2017-12-14
      • 2019-09-17
      • 1970-01-01
      相关资源
      最近更新 更多