【问题标题】:Remove duplicate rows from Pandas dataframe where only some columns have the same value根据另一列删除熊猫数据框中的整行[重复]
【发布时间】:2021-12-02 02:00:12
【问题描述】:

我有一个看起来像这样的数据框:

  name   color    qty
   A     blue     10     
   B     red      3
   B     yellow   5 
   B     green    12
   C     white    20
   C      red     3

我想删除 name 重复的行,但保留第一行以便我可以得到这个:

  name   color    qty
   A     blue     10     
   B     red      3
   C     white    20

我怎样才能做到这一点?

【问题讨论】:

  • 使用df.drop_duplicates(subset=['name'], inplace=True)

标签: python pandas dataframe duplicates


【解决方案1】:

您可以使用drop_duplicates 中的keep='first',如下所示:

>>>  df.drop_duplicates('col1', keep='first')
  name   color    qty
   A     blue     10     
   B     red      3
   C     white    20

【讨论】:

    猜你喜欢
    • 2017-10-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-02-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多