【发布时间】:2012-09-29 00:59:58
【问题描述】:
我在这里看到了一些相关的问题,但它们并没有完全谈论我面临的同一个问题。
我想使用 HTML Agility Pack 从我的 HTML 中删除不需要的标签,而不会丢失标签中的内容。
例如,在我的场景中,我想保留标签“b”、“i”和“u”。
对于像这样的输入:
<p>my paragraph <div>and my <b>div</b></div> are <i>italic</i> and <b>bold</b></p>
生成的 HTML 应该是:
my paragraph and my <b>div</b> are <i>italic</i> and <b>bold</b>
我尝试使用HtmlNode 的Remove 方法,但它也删除了我的内容。有什么建议吗?
【问题讨论】:
-
你试过
HtmlNode.RemoveChild(HtmlNode oldChild, bool keepGrandChildren)的方法吗? -
@bidou 如果必须强制执行安全性,我非常怀疑使用正则表达式是个好主意。
标签: c# html-agility-pack