【问题标题】:Finding valid IP addresses with regex使用正则表达式查找有效 IP 地址
【发布时间】:2014-01-10 15:25:29
【问题描述】:

我有以下字符串:

text = '10.0.0.1.1 but 127.0.0.256 1.1.1.1'

我想返回有效的IP地址,所以这里应该只返回1.1.1.1,因为256高于255,而且第一个IP的数字太多了。

到目前为止,我有以下内容,但不适用于 0-255 要求。

text = "10.0.0.1.1 but 127.0.0.256 1.1.1.1"
l = []
import re
for word in text.split(" "):
    if word.count(".") == 3:
        l = re.findall(r"[\d{1,3}]+\.[\d{1,3}]+\.[\d{1,3}]+\.[\d{1,3}]+",word)

【问题讨论】:

标签: python regex ip


【解决方案1】:

这是一个 python 正则表达式,它可以很好地从字符串中获取有效的 IPv4 IP 地址:

import re
reValidIPv4 = re.compile(r"""
    # Match a valid IPv4 in the wild.
    (?:                                         # Group two start-of-IP assertions.
      ^                                         # Either the start of a line,
    | (?<=\s)                                   # or preceeded by whitespace.
    )                                           # Group two start-of-IP assertions.
    (?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)    # First number in range 0-255 
    (?:                                         # Exactly 3 additional numbers.
      \.                                        # Numbers separated by dot.
      (?:25[0-5]|2[0-4][0-9]|[01]?[0-9][0-9]?)  # Number in range 0-255 .
    ){3}                                        # Exactly 3 additional numbers.
    (?=$|\s)                                    # End IP on whitespace or EOL.
    """, re.VERBOSE | re.MULTILINE)

text = "10.0.0.1.1 but 127.0.0.256 1.1.1.1"
l = reValidIPv4.findall(text)
print(l)

【讨论】:

  • 我对你的 cmets 感到困惑,它是从第二组还是第一组开始的?我看到该评论列出了两次,我正在努力了解更多。
  • @wannabe_n00b - 我明白你为什么感到困惑 - 我的措辞很糟糕。此正则表达式中实际上没有捕获组。第一个(非捕获)组是:“将两个备选方案分组,每个都是一个断言” 我总是在每个组的结尾重复注释以关联组的开始和结束评论明智的。
  • 如果我把你的代码改成[01]会有什么影响?[0-9]?[0-9]?好像会更好?
  • @wannabe_n00b - 表达式:[01]?[0-9]?[0-9]? 匹配一个空字符串(即,它匹配曾经存在的每个字符串中的每个位置)。这是行不通的,因为在 4 个 IPv4 虚线四边形位置中的每一个位置都需要至少有一个数字。
  • 如果您的 IP 为“0.0.0.1”,该 IP 如何针对 [01]?[0-9][0-9]? 进行评估?[01]? 会不会获取数字,但随后在 manditory @987654325 上失败@
猜你喜欢
  • 2020-04-06
  • 1970-01-01
  • 2021-10-26
  • 2017-01-24
  • 2011-06-20
  • 2017-03-15
  • 2015-11-22
相关资源
最近更新 更多