【问题标题】:Regex Python: Get Page and Subpage from URL正则表达式 Python:从 URL 获取页面和子页面
【发布时间】:2013-02-20 18:29:36
【问题描述】:

很抱歉,我很早就对正则表达式不熟悉了。

如何从这种字符串 /projects/myproject/ 中获取以下 2 个元素(projectsmyproject)?

输出:

print group1 : 'projects'

print group2 : 'myproject'

谢谢

【问题讨论】:

  • 这可能不是正则表达式的工作,而是您选择的语言的现有工具。您使用什么语言?您可能不想使用正则表达式,而是使用已经编写、测试和调试过的现有模块。如果您使用的是 PHP,则需要 parse_url 函数。如果您使用 Perl,则需要 URI 模块。如果您使用的是 Ruby,请使用 URI 模块。
  • 我正在使用 Python,我在帖子标题中注意到了它:)
  • 我知道,但我不知道 Python 使用什么。关键是,有现成的书面、测试和调试工具可供您使用。

标签: python regex


【解决方案1】:
my_str = "/projects/myproject/"
matches = re.findall("/(.+?)/(.+)/",my_str)
print matches  #prints ['projects','myproject']

【讨论】:

  • 你的正则表达式正在工作,但这是我得到的:[('projects', 'targetstuffscholarships/')] 1) 最后一个“/”仍然在这里 2) 我怎样才能得到一个数组因为它实际上是一个数组中的列表谢谢
  • matches 是正则表达式匹配的字符串数组。不是数组数组。而且,你能告诉我们你要匹配的字符串吗?
  • 字符串是:/projects/targetstuffscholarships/
  • 我得到的不是数组数组,而是数组中包含的列表。我输出中的括号意味着它实际上是一个列表
  • matches[0] 是您所追求的。您可以访问您的匹配项,例如 matches[0][0]matches[0][1]
猜你喜欢
  • 2013-02-03
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2022-11-18
  • 2011-06-26
  • 2016-12-14
  • 2017-09-20
相关资源
最近更新 更多