【发布时间】:2021-06-16 19:36:08
【问题描述】:
我翻遍了很多 SO 的帖子,只是为了找到一个符合我情况的 Pandas 解决方案,但我找不到。
我遇到的问题是我有Dataframe,如下所示:
$ df
email hashes
0 user@example.com (iz3s65inn942j1bmedv., iz3s65inn942j1bmedv., 10$0mw1ewlhqlm0l)
在我的情况下,nunique() 和 drop_duplicates() 不起作用,因为我需要计算元组本身中非重复元素的数量。在上述情况下,结果将是:
$ df
email hashes
0 user@example.com 1
如何实现此结果并获取哈希列中元组的非重复元素的计数?
【问题讨论】:
-
@jezrael
drop_duplicates适用于数据帧的行而不是列内的元组。如果您调用该函数,则该行不会发生任何事情。
标签: python-3.x pandas duplicates