【发布时间】:2017-09-16 03:00:30
【问题描述】:
pandas df 有 11 列需要使用正则表达式修改前 3 列,并使用修改后的列添加一个新列,并将其用于下游连接,像这样我需要保持这些列中的元素并使其成为唯一字符串
column1 column2 column3 column4 ...column 11
需要这样做 new_col = column1:column2-column3(column4)
制作这个新专栏,
column1 column2 column3 newcol column4 ...column 11
我可以使用简单的 python 一行来做到这一点,不知道 pandas 的语法是什么
l = cols[0] + ":" + cols[1] + "-" + cols[2] + "(" + cols[5] + ")"
【问题讨论】:
-
如果
cols[0]、cols[1]、cols[2]和cols[5]是字符串,您的示例代码将可以正常工作。如果没有,您需要在组合它们之前将它们转换为字符串。在标准 python 代码中,您可以使用str(cols[0])来执行此操作。使用 pandas 列,您可以使用cols[0].astype(str)执行此操作。 -
同意,但我仍然不知道如何向现有 df 添加新列
标签: python string python-2.7 pandas