【发布时间】:2020-02-11 10:51:39
【问题描述】:
我有带有 1 列列表的 pandas df。我想对至少有一个共同元素的所有列表进行分组。
Input Df :
>
Category
0 [IAB19, IAB81, IAB82]
1 [IAB25, IAB27]
2 [IAB19, IAB20]
3 [IAB22, IAB55, IAB56, IAB58]
4 [IAB81, IAB89]
5 [IAB82, IAB95]
我想知道 df['Category'] 中的任何代码是否存在于 df['Category'] 的任何其他行中。
如果是,我想合并那些共享至少 1 个共同元素的列表。
预期输出:
Category
0 [IAB19, IAB81, IAB82, IAB20, IAB89, IAB95]
1 [IAB25, IAB27]
2 [IAB22, IAB55, IAB56, IAB58]
有什么想法吗?
【问题讨论】:
-
您必须构建一个图并对每个不相交图进行分组
-
在这方面使用 Pandas 没有什么意义
-
@rafaelc 我们不能使用 substr 或其他东西匹配列表,并在它们匹配的任何地方分配相同的 id。然后使用分配的 id 进行分组?
标签: python pandas list pandas-groupby apply