【问题标题】:Find all <a href> HTML tags and append target blank values using Python regular expression使用 Python 正则表达式查找所有 <a href> HTML 标记并附加目标空白值
【发布时间】:2022-11-21 13:29:04
【问题描述】:

我想找到所有

<a href='https://example.com/'>

大文件中的引用并附加

target='_blank' rel='noopener noreferrer'

标签末尾的选项,如果它丢失了。

大致上,我做了以下事情:

re.sub(r'<a href=([^>]+)', r'<a href=([^>]+)' + " target='_blank' rel='noopener noreferrer'", content)

注意:内容包含要更改的文本正文。

但是,第二个参数(应该是要替换的值)弄乱了结果。

我得到的输出是:

<a href=([^>]+) target='_blank' rel='noopener noreferrer'>

预期结果应该是:

<a href='https://example.com/' target='_blank' rel='noopener noreferrer'>

我做错了什么,我该如何解决这个问题?

【问题讨论】:

标签: python append


【解决方案1】:

如果您可以使用第 3 方库,BeautifulSoup 可能非常适合您!
https://www.crummy.com/software/BeautifulSoup/bs4/doc/

from bs4 import BeautifulSoup
soup = BeautifulSoup(html_contents, "html.parser")
soup.find_all("a")

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2014-01-17
    • 2014-01-29
    • 2010-12-10
    • 2013-06-18
    • 2013-09-05
    • 1970-01-01
    • 2011-04-19
    相关资源
    最近更新 更多