【发布时间】:2019-01-02 14:10:39
【问题描述】:
我想删除 col1 的重复值,只保存 col2 中具有最高值的行。例子df:
df1 = pd.DataFrame({'col1': ['a', 'a', 'b', 'b', 'c'],
'col2': [5, 5, 10, 15, 20]})
我知道df1.drop_duplicates 会删除重复值,但我如何确保它是保存的最高值(或多个值,如果有与最高值相关的值)?
期望的输出:
dfoutput = pd.DataFrame({'col1': ['a', 'a', 'b', 'c'],
'col2': [5, 5, 15, 20]})
【问题讨论】:
标签: python pandas dataframe duplicates