【发布时间】:2015-06-21 20:04:26
【问题描述】:
我目前正在开发的程序从网站检索 URL 并将它们放入列表中。我想得到的是 URL 的最后一部分。
因此,如果我的 URL 列表中的第一个元素是 "https://docs.python.org/3.4/tutorial/interpreter.html",我想删除 "interpreter.html" 之前的所有内容。
我可以使用函数、库或正则表达式来实现这一点吗?我查看了其他 Stack Overflow 帖子,但解决方案似乎不起作用。
这是我的几次尝试中的两次:
for link in link_list:
file_names.append(link.replace('/[^/]*$',''))
print(file_names)
&
for link in link_list:
file_names.append(link.rpartition('//')[-1])
print(file_names)
【问题讨论】:
-
你怎么知道他们没有工作?您收到错误消息了吗?
-
@Kevin 输出不正确。
-
为什么你的
rpartition()尝试用反斜杠而不是正斜杠分割? -
@TigerhawkT3 对不起。刚刚修好了
-
现在它在一对正斜杠上而不是一个斜杠上拆分(正斜杠不需要转义)。
标签: python regex string replace