在 Pandas DataFrame 中过滤一列字符串列表答案

【问题标题】：Filtering a column of lists of strings in a Pandas DataFrame在 Pandas DataFrame 中过滤一列字符串列表
【发布时间】：2021-02-08 02:53:11
【问题描述】：

df=pd.DataFrame({'sym':['A', 'B', 'C', 'D'],'event':[['1','2', '3'], ['1'], ['2', '3'],['2']]} )

    sym event
0   A   [1, 2, 3]
1   B   [1]
2   C   [2, 3]
3   D   [2]

事件列由字符串列表组成。我正在尝试过滤包含“3”的任何行的事件列，因此我正在寻找索引 0 和 2。

我知道使用

["3" in df.event[0]]

对于每一行，我认为 lambda 函数会将我推过终点线。

【问题讨论】：

【解决方案1】：

请尝试：

print(df[df.event.astype(str).str.contains(r'\b3\b')])



sym      event
0   A  [1, 2, 3]
2   C     [2, 3]

【讨论】：

【解决方案2】：

Series.explode to split list-like values to rows

使用explode 将列表转为行：

'3' in df['event'].explode().values

要查找哪一行包含“3”，请使用索引：

idx = df['event'].explode() == '3'
df.loc[idx[idx].index]

【讨论】：

【解决方案3】：

让我们试试

out = df[pd.DataFrame(df.event.tolist()).isin(['3']).any(1).values]
Out[78]: 
  sym      event
0   A  [1, 2, 3]
2   C     [2, 3]

【讨论】：