【发布时间】:2019-12-14 04:01:09
【问题描述】:
我想删除 pandas 数据框中的行,其中一列 A 中的值是重复的,而另一列 B 中的值在给定 A 的情况下不重复。一个说明性示例:
df = pd.DataFrame({'A': ['cat', 'dog', 'cat', 'cat', 'bat'],
'B': ['x', 'y', 'x', 'z', 'z'],
'C': [10, 20, 30, 40, 50]})
所需的输出已删除第 3 行,因为“cat”是重复的,“z”在“cat”行中是不同的:
df.drop_duplicates('A') 删除第 2 行和第 3 行,df.drop_duplicates(subset=['A', 'B']) 删除第 2 行;我在这里寻找的也不是 [1]。
【问题讨论】:
标签: python pandas dataframe duplicates