【问题标题】:Remove html tags with their contents using Python使用 Python 删除 html 标签及其内容
【发布时间】:2020-11-11 12:46:07
【问题描述】:

有什么选项可以删除带有内容的 html 标签?

我只发现了将文本保留在标签内的条形标签功能。

我想要删除标签及其内容

例如:"Teste: <b> oi</b> nome" 将是 "Teste: nome"

谢谢。

【问题讨论】:

  • 到目前为止你有什么尝试?
  • 在处理 html 解析时最好使用漂亮的汤。

标签: python html regex function strip-tags


【解决方案1】:

你可以尝试正则表达式来实现它。

import re
s = "Teste: <b> oi</b> nome"
replaced = re.sub('<.*?>.*?</.*?>', '', s)
print(replaced) 

【讨论】:

    猜你喜欢
    • 2010-12-03
    • 2022-11-21
    • 1970-01-01
    • 1970-01-01
    • 2013-12-07
    • 2018-10-28
    • 2014-06-11
    • 1970-01-01
    • 2019-03-22
    相关资源
    最近更新 更多