1.如何实现两个dataframe去重()?

假设df1是所有的数据,现在想去除与df2中重复的数据,也就是实现对df1进行操作,让他的数据不再包括df2。
方法一:先把需要剔除的df2的某一列(如id)用tolist输出成一个列表,然后前一个df用~isin(列表)来去除
例子:
same_list=df2['ID'].tolist()
df1=df1[~df1['ID'].isin(same_list)]

方法二:将df2先和df1合并,在利用drop_duplicates()去重

例子:

df1=df1.append(df2).drop_duplicates(keep=False) #keep=false保留不相同的

 

相关文章:

  • 2021-07-21
  • 2022-12-23
  • 2022-12-23
  • 2021-10-28
  • 2021-07-17
  • 2021-08-21
  • 2022-12-23
  • 2021-11-19
猜你喜欢
  • 2022-01-31
  • 2021-12-30
  • 2021-11-06
  • 2021-08-04
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
相关资源
相似解决方案