【发布时间】:2020-02-28 18:08:54
【问题描述】:
我有一个数据框,其中包含根据四列(SFDC_ID 和 left_side 和 right_SFDC_ID 以及 right_side 和相似性)的重复值:
目前 SFDC_ID 和 right_SFDC_ID 以下列方式复制:
SFDC_ID left_side right_SFDC_ID right_side similairity
0013s00000vEVuwAAG Hague Quality Water 0013s00000vEW72AAG Hague Quality Waters 0.99023304
0013s00000vEW72AAG Hague Quality Waters 0013s00000vEVuwAAG Hague Quality Water 0.99023304
如果仔细观察,第 1 行的 SFDC_ID 与第 2 行的 right_SFDC_ID 相同。
如何使用 pandas 删除第二行?
【问题讨论】:
-
我建议您更好地格式化您的数据,因为目前无法判断 Haque 水质是单独的列还是与 0013 组合...
-
在 Stackoverflow 中更好地格式化它?我相信我更新了这个