【发布时间】:2020-01-15 06:50:30
【问题描述】:
我正在尝试在数据框中连接 2 个(字符串)列 'col1' 和 'col2',将连接的字符串标记化并将结果列表另存为另一个新列 'result'。
期望的输出:
col1 col2 result
apples bananas oranges ['apples','bananas','oranges']
mangoes apples ['mangoes','apples']
我正在这样做:
df['result'] = df['col1'].str.cat(df['col2'],sep=" ")
df['result'] = df.result.apply(lambda result: list(re.split(r'\W+', result)))
但我得到这个作为输出:
col1 col2 result
apples bananas oranges [apples,bananas,oranges]
mangoes apples [mangoes,apples]
我该如何解决这个问题?
【问题讨论】:
标签: python-3.x pandas dataframe concatenation list-comprehension