用于域匹配的嵌套正则表达式答案

【问题标题】：Nested regular expression for domain matching用于域匹配的嵌套正则表达式
【发布时间】：2014-11-29 23:46:22
【问题描述】：

给定域名my.local.domain.com，我想提取以下部分：

匹配 #1：my.local.domain ... 不包括顶级域 (com)
匹配 #2：local.domain ... 不包括顶级域 (com) 和第一部分 (my)
匹配 #3：domain ... 不包括顶级域 (com) 和两个前导部分 (my.local)

正则表达式不必匹配无限数量的点分隔部分，如果字符串变长，则只有后面的 3 个部分是相关的。

my.local.domain.com:
#1：my.local.domain
#2：local.domain
#3：domain

my.other.local.domain.com
#1：my.other.local.domain
#2：local.domain
#3：domain

如果它更短，则应该匹配：

domain.com
#1：domain
#2：domain

到目前为止，这是我的正则表达式：^(.+\.(.+\.(.+)?)?)\.com$，问题是只要域中的点分隔部分少于 4 个，它就不再起作用了。我正在努力使内括号可选。

对此有任何提示吗？非常感谢！

【问题讨论】：

【解决方案1】：

由于可选性限制，它变得有点复杂，但以下适用于您的示例：

((?:\w+\.)*?(\w*?\.?(\w+)))\.com$

查看http://regex101.com/r/aJ6bZ0/1上所有运营商的技术说明

逻辑如下：

【讨论】：

【解决方案2】：

“+”正则表达式符号可以被认为是“一次或多次”。您可能想使用 '*' - 0 次或多次或 '?' - 0 或 1 次。这适用于您的文字“。”同样，应该发生什么？或者根据您上面的解释0次或多次。

请参阅this google search 以获取大量方便的参考资料，以进一步提供帮助。（他们都说大体相同的事情，但有选择的感觉很好）

【讨论】：