【问题标题】:Pandas - remove duplicate items completely from dataframe [duplicate]Pandas - 从数据框中完全删除重复项[重复]
【发布时间】:2020-11-09 00:29:12
【问题描述】:

我想从 pandas 数据框中完全删除重复项。例如,我有数据框:

  location     area
0  mountain view  1044ft2
1      palo alto     None
2  mountain view   890ft2
3     san carlos  1000ft2
4        belmont     None

我想做的是在location 列中找到唯一值,并完全删除所有重复的项目,等等。所以最终产品将如下所示(通知mountain view 已消失):

  location     area
1      palo alto     None
3     san carlos  1000ft2
4        belmont     None

谢谢。

【问题讨论】:

  • df.drop_duplicates('location',keep=False)
  • 非常简单!谢谢,没有注意到关于 SO 的重复问题,但感谢您的帮助@anky
  • 没问题,搜索有时不能找到确切的问题,完全明白..!!很高兴它有所帮助:)

标签: python python-3.x pandas numpy dataframe


【解决方案1】:

使用

df.drop_duplicates(subset='location', keep=False)

【讨论】:

    猜你喜欢
    • 2020-12-23
    • 2017-09-16
    • 2022-11-14
    • 2014-03-10
    • 2018-02-24
    • 2021-06-01
    • 2020-05-08
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多