使用 re.findall 字符串匹配提取 URL 链接答案

【问题标题】：Extracting URL link using re.findall string matching使用 re.findall 字符串匹配提取 URL 链接
【发布时间】：2021-02-03 18:26:54
【问题描述】：

我想从以下 URL 中提取以下内容：326/4050/98D32716-2756-404D-9E27-DB02D71BF62D.

class="text-primary font-weight-bolder text-left" href="/salg/info/326/4050/98D32716-2756-404D-9E27-DB02D71BF62D"

我试过了，但还是不行：

re.findall(r'https?://[^\s<>"]+|www\.[^\s<>"]+',link["href"])

请任何人提供一些有用的指导？

【问题讨论】：

不工作 = 什么？如果你是一名医生，而一个病人来找你说“我的身体不行了”怎么办？

标签： python string url extract

【解决方案1】：

如果它对你有用，请告诉我：

import re

string = 'class="text-primary font-weight-bolder text-left" href="/salg/info/326/4050/98D32716-2756-404D-9E27-DB02D71BF62D"'

x = re.search(r'class="text-primary font-weight-bolder text-left" href="/salg/info/(.*)"',string)
print(x.group(1))

输出：

326/4050/98D32716-2756-404D-9E27-DB02D71BF62D

在线尝试正则表达式的好页面是regex101

【讨论】：