正则表达式 Python：从 URL 获取页面和子页面答案

【问题标题】：Regex Python: Get Page and Subpage from URL正则表达式 Python：从 URL 获取页面和子页面
【发布时间】：2013-02-20 18:29:36
【问题描述】：

很抱歉，我很早就对正则表达式不熟悉了。

如何从这种字符串 /projects/myproject/ 中获取以下 2 个元素（projects 、myproject）？

输出：

print group1 : 'projects'

print group2 : 'myproject'

谢谢

【问题讨论】：

这可能不是正则表达式的工作，而是您选择的语言的现有工具。您使用什么语言？您可能不想使用正则表达式，而是使用已经编写、测试和调试过的现有模块。如果您使用的是 PHP，则需要 parse_url 函数。如果您使用 Perl，则需要 URI 模块。如果您使用的是 Ruby，请使用 URI 模块。
我正在使用 Python，我在帖子标题中注意到了它：)
我知道，但我不知道 Python 使用什么。关键是，有现成的书面、测试和调试工具可供您使用。
重复stackoverflow.com/questions/7894384/…

【解决方案1】：

my_str = "/projects/myproject/"
matches = re.findall("/(.+?)/(.+)/",my_str)
print matches  #prints ['projects','myproject']

【讨论】：

你的正则表达式正在工作，但这是我得到的：[('projects', 'targetstuffscholarships/')] 1) 最后一个“/”仍然在这里 2) 我怎样才能得到一个数组因为它实际上是一个数组中的列表谢谢
matches 是正则表达式匹配的字符串数组。不是数组数组。而且，你能告诉我们你要匹配的字符串吗？
字符串是：/projects/targetstuffscholarships/
我得到的不是数组数组，而是数组中包含的列表。我输出中的括号意味着它实际上是一个列表
matches[0] 是您所追求的。您可以访问您的匹配项，例如 matches[0][0] 和 matches[0][1]