【问题标题】:Extracting URL link using re.findall string matching使用 re.findall 字符串匹配提取 URL 链接
【发布时间】:2021-02-03 18:26:54
【问题描述】:

我想从以下 URL 中提取以下内容:326/4050/98D32716-2756-404D-9E27-DB02D71BF62D.

class="text-primary font-weight-bolder text-left" href="/salg/info/326/4050/98D32716-2756-404D-9E27-DB02D71BF62D"

我试过了,但还是不行:

re.findall(r'https?://[^\s<>"]+|www\.[^\s<>"]+',link["href"])

请任何人提供一些有用的指导?

【问题讨论】:

  • 不工作 = 什么?如果你是一名医生,而一个病人来找你说“我的身体不行了”怎么办?

标签: python string url extract


【解决方案1】:

如果它对你有用,请告诉我:

import re

string = 'class="text-primary font-weight-bolder text-left" href="/salg/info/326/4050/98D32716-2756-404D-9E27-DB02D71BF62D"'

x = re.search(r'class="text-primary font-weight-bolder text-left" href="/salg/info/(.*)"',string)
print(x.group(1))

输出:

326/4050/98D32716-2756-404D-9E27-DB02D71BF62D

在线尝试正则表达式的好页面是regex101

【讨论】:

    猜你喜欢
    • 2012-05-15
    • 1970-01-01
    • 1970-01-01
    • 2011-06-08
    • 1970-01-01
    • 2016-04-06
    • 2017-11-17
    • 2019-03-14
    • 1970-01-01
    相关资源
    最近更新 更多