【问题标题】:Regular expression to strip all HTML tags except sub & sup tags正则表达式去除除 sub 和 sup 标签之外的所有 HTML 标签
【发布时间】:2023-03-10 17:47:01
【问题描述】:

我需要从字符串中去除除<sub></sub> & <sup></sup> 标签之外的所有html标签。

假设一个字符串是"<p>Hello world</p> <span class="required">H<sub>2</sub>O</span>"
输出应该是Hello world H<sub>2</sub>O

【问题讨论】:

标签: c# html regex tags


【解决方案1】:

与使用正则表达式相比,您可能会发现使用Html Agility Pack 之类的东西更容易,它为您提供了一个可读写的DOM

【讨论】:

  • 请有人写一个机器人来回答所有包含“regex”“HTML”和“Html Agility Pack”的问题;-)
  • ...并链接关于 html 的不规则性的那篇很棒的文章(见第一个问题评论),因此(一般)不可能使用正则表达式来解析它(通常,但有很多不过可以解决的问题。)
  • @UweKelm Popup:“您的问题似乎是关于使用正则表达式解析 HTML。也许您应该先阅读以下内容:”stackoverflow.com/questions/1732348/…
猜你喜欢
  • 2011-05-15
  • 2011-05-03
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2010-09-07
相关资源
最近更新 更多