【发布时间】:2017-11-06 02:14:51
【问题描述】:
我在使用 re 库从 URL 中提取字符串时遇到了一些麻烦。
这是一个例子:
http://www.example.it/remoteconnexion.aspx?u=xxxxx@abc.it&direction=vente.aspx%3pid%xx123%63abcd"
我有一个数据框,我想使用另一列中的值添加一列,在此示例中 df['URL_REG'] 包含:'123'?
df['URL_REG'] = df['URL'].map(lambda x : re.findall(r'[REGEX]+', x)[0])
URL 的结构可以改变,但我想要的部分总是在 'direction=vente.aspx%3pid%' 和 '%' 之间。
【问题讨论】:
标签: python regex pandas parsing dataframe