【问题标题】:RegEx for capturing group not recognized用于捕获组的正则表达式无法识别
【发布时间】:2019-09-27 20:15:44
【问题描述】:

我有以下正则表达式:

(?:\/(?<root>family-resources|employer-resources|newsroom|text-pages))?\/(?:(?<path>[0-9A-z=\-\s]+\/?)+)

如您所见,我正在尝试设置两个命名捕获组 - rootpath。但是,在运行此程序并检查匹配组时,没有 root 组 - 只有 path

使用 C#:

root = match.Groups["root"]?.Value ?? "Text Pages"; // Returns an empty string as the root group is missing.

我能够通过在https://regex101.com/ 上运行正则表达式模式来重现这一点。

如果您输入以下测试字符串:

/sitecore/content/Corporate-New/home/employer-resources/back-up-care

你会注意到你只得到一个命名的捕获组 - path
为什么root 没有被退回?

似乎我对命名捕获组使用了正确的语法。我已经尝试在捕获组之外和正则表达式模式内添加括号,但都没有奏效。我在想也许正则表达式模式没有被理解。

【问题讨论】:

    标签: c# regex regex-group named-captures


    【解决方案1】:

    试试这个正则表达式:

    (?:.*\/(?<root>family\-resources|employer\-resources|newsroom|text\-pages))?\/(?:(?<path>[0-9A-z=\-\s]+\/?)+)
    

    我在每个 - 前面添加了一个反斜杠,因为它们是保留的,并且在开头添加了一个 .* 以接受第一组之前的任何路径。

    (?: ) 要求括号之间的所有内容都在非捕获组中。 .* 允许路径的开头与模式匹配。否则,遇到的第一个斜杠将匹配并停止解析(在 sitecore)。

    另一种解决方案是使用后视:

    (?<=\/)(?<root>family\-resources|employer\-resources|newsroom|text\-pages)?\/(?:(?<path>[0-9A-z=\-\s]+\/?)+)
    

    这稍微高级一些,但更接近您试图实现的目标。

    【讨论】:

    • 成功了,特别是.* 部分。有什么特别的理由需要这样做吗?无论如何,标记为已解决...谢谢!
    • 我添加了一个解释,以及一个替代的、更高级的解决方案。
    • 谢谢!有道理。
    猜你喜欢
    • 2011-06-03
    • 2014-04-25
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2022-12-04
    • 2012-10-10
    • 2018-08-20
    相关资源
    最近更新 更多