在进行数据探索的时候会遇到求交集的情况,比如说:优惠卷预测的时候,有多张表,表1有用户id,表2也有用户id,但是不能确定表1的用户有多少出现在表2当中。

un_id1,un_id2 为两个 Series 对象:

un_id1 = set(un_id1)
un_id2 = set(un_id2)
tmp = un_id1.intersection(un_id2)
len(tmp)

即可求出交集的个数。。

 

 

后来又找到一个去重函数:drop_duplicates

相关文章:

  • 2021-10-28
  • 2022-02-07
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-06-14
  • 2021-11-28
猜你喜欢
  • 2021-08-22
  • 2021-07-23
  • 2021-09-15
  • 2022-12-23
  • 2022-12-23
  • 2021-11-20
相关资源
相似解决方案