【发布时间】:2014-05-04 21:26:12
【问题描述】:
我有这个带有重叠标签的格式错误的 HTML:
<p>word1<b>word2</p>
<p>word3</b>word4</p>
重叠也可以嵌套。
如何使用 HTML Agility Pack (HAP) 将其转换为格式良好的 HTML?
我正在寻找这个输出:
<p>word1<b>word2</b></p>
<p><b>word3</b>word4</p>
我尝试了HtmlNode.ElementsFlags["b"] = HtmlElementFlag.Closed | HtmlElementFlag.CanOverlap,但它没有按预期工作。
【问题讨论】:
标签: c# html .net parsing html-agility-pack