【发布时间】:2016-05-21 20:12:28
【问题描述】:
使用此处的示例Drop all duplicate rows in Python Pandas
假设我不想删除重复项,而是更改子集中其中一列中的数据值。
因此,根据示例,如果我们使用 subset=['A','C'] 来识别重复项,那么我想将第 1 行的列 'A' 从 foo 更改为 foo1。
我有一种复杂的方法来做到这一点,但必须有一种更简单的方法来利用矢量化/内置功能。
原始df:
A B C
0 foo 0 A
1 foo 1 A
2 foo 1 B
3 bar 1 A
所需的df:
A B C
0 foo 0 A
1 foo1 1 A
2 foo 1 B
3 bar 1 A
【问题讨论】:
标签: python pandas duplicates