【发布时间】:2018-08-23 21:04:47
【问题描述】:
我有一个小数据框,正在尝试从 Links 列中字符串的结尾。我已经尝试了以下代码,它适用于 url 独立的列。问题是,只要网址前有句子,代码就不会删除这些网址
这是数据:https://docs.google.com/spreadsheets/d/10LV8BHgofXKTwG-MqRraj0YWez-1vcwzzTJpRhdWgew/edit?usp=sharing(电子表格链接)
import pandas as pd
df = pd.read_csv('TestData.csv')
df['Links'] = df['Links'].replace(to_replace=r'^https?:\/\/.*[\r\n]*',value='',regex=True)
df.head()
谢谢!
【问题讨论】:
-
请不要使用第三方网站的链接。在您的问题中包含尽可能多的相关数据。另外,包括预期结果。
-
只需删除固定句子起点的
^部分。这将解决您的问题 -
@Onyambu 谢谢,这就是我们所需要的。
标签: python python-3.x pandas