【发布时间】:2021-04-28 22:03:50
【问题描述】:
我有包含多列的 DataFrame,而少数列包含列表值。通过只考虑其中包含列表值的列,必须删除重复的行。
当前数据框:
ID col1 col2 col3 col4
1 52 [kjd,pkh,sws] [aqs,zxc,asd] [plm,okn,ijb]
2 47 [qaz,wsx,edc] [aws,rfc,tgb] [rty,wer,dfg]
3 85 [kjd,pkh,sws] [aqs,zxc,asd] [plm,okn,ijb]
4 27 [asw,bxs,mdh] [wka,kdy,kaw] [pqm,lsc,yhb]
期望的输出:
ID col1 col2 col3 col4
2 47 [qaz,wsx,edc] [aws,rfc,tgb] [rty,wer,dfg]
4 27 [asw,bxs,mdh] [wka,kdy,kaw] [pqm,lsc,yhb]
我尝试将其转换为元组并应用 df.drop_duplicates() 但出现多个错误
【问题讨论】:
-
不,我已经试过了。由于我在列值中有 List 它会产生错误
-
drop_duplicates适用于您为我提供的示例。如果您仍然遇到问题,只需编辑您的帖子,详细了解您在drop_duplicates遇到的问题。 -
我认为作为答案提到的帖子不是这个问题的真正答案,而这篇帖子是答案:stackoverflow.com/a/52949875/7206701
-
重复列表中的元素顺序会改变吗?
-
@HooriM。这个答案将单列转换为元组,但我的问题有三列包含列表值
标签: python pandas list dataframe drop-duplicates