【发布时间】:2017-05-25 15:40:50
【问题描述】:
我有一个包含两列 ID 和 Salary 的数据框
data = {'ID':[1,2,3,4,2],'salary':[1e3,1.2e3,1e3,2e3,1.5e3]}
+----+--------+
| ID | salary |
+----+--------+
| 1 | 1000.0 |
+----+--------+
| 2 | 1200.0 |
+----+--------+
| 3 | 1000.0 |
+----+--------+
| 4 | 2000.0 |
+----+--------+
| 2 | 1500.0 |
+----+--------+
在此数据框中,某些 ID 重复,在这种情况下 ID=2。 我想保留每个重复 ID 的最高工资。
+----+--------+
| ID | salary |
+----+--------+
| 1 | 1000.0 |
+----+--------+
| 2 | 1500.0 |
+----+--------+
| 3 | 1000.0 |
+----+--------+
| 4 | 2000.0 |
+----+--------+
【问题讨论】:
标签: python pandas dataframe duplicates