【发布时间】:2020-10-02 00:15:23
【问题描述】:
我有一个大数据框,里面有很多重复项。我想保留每个重复项的第一个和最后一个条目,但在两者之间删除每个重复项。
我已经尝试通过使用带有参数“first”和“last”的 df.drop_duplicates 来获得两个数据帧,然后将它们再次合并到一个 df 中,这样我就有了第一个和最后一个条目,但是没用。
df_first = df
df_last = df
df_first['Path'].drop_duplicates(keep='first', inplace=True)
df_last['Path'].drop_duplicates(keep='last', inplace=True)
提前感谢您的帮助!
【问题讨论】:
-
你能分享一个样本和预期的输出吗??
标签: python pandas dataframe duplicates