【问题标题】:Merging filled row cells with ignoring empty cells in Python合并填充的行单元格并忽略Python中的空单元格
【发布时间】:2019-12-16 13:47:31
【问题描述】:

经过一些数据预处理后,我陷入了合并数据集的困境。我想要做的是根据相同的批次号将同一列下的所有日期按行顺序合并。通常它是堆叠的数据,然后我根据流程步骤(40,42,50)进行了堆叠。那么我的意图是将两列的时间差作为分钟。

数据集:

         process     40-------------------42-----------------------50

index   batch   

64177   699042  NaT------------------2019-01-10 18:28:05-------NaT

171272  699042  NaT------------------NaT-------------------- 2019-01-10 18:28:20

120655  699042  2019-01-10 17:40:09--NaT----------------------NaT

120656  699043  2019-01-10 17:40:09--NaT----------------------NaT

67362   699043  NaT------------------2019-01-10 20:43:25-------NaT

168373  699043  NaT------------------NaT-----------------------2019-01-10 20:43:33

我想要什么:

         process     40-------------------42-----------------------50
batch   

699042  2019-01-10 17:40:09-----2019-01-10 18:28:05-------2019-01-10 18:28:20

699043  2019-01-10 17:40:09----2019-01-10 20:43:25-------2019-01-10 20:43:33

【问题讨论】:

    标签: python pandas merging-data


    【解决方案1】:

    你可以试试groupbyfirst

    urdf=df.groupby(level=1).first()
    

    【讨论】:

    • 它绝对解决了我的问题。我没有考虑 groupby 中“级别”和“第一个”术语的用法。我学到了新东西。我会对此进行锻炼。非常感谢。
    • @OmerElmasri yw:-) 节日快乐
    • 祝你节日快乐 :)