【发布时间】:2010-09-06 20:00:40
【问题描述】:
我正在寻找在 PHP 中处理 HTML 的好方法。例如,我目前遇到的问题是处理格式错误的 HTML。
我收到的输入看起来像这样:
<div>This is some <b>text
如您所见,HTML 缺少结束标记。我可以使用正则表达式或 XML 解析器来解决这个问题。但是,将来我可能不得不进行其他 DOM 操作。我想知道是否有任何好的 PHP 库可以处理 DOM 操作,类似于 Javascript 处理 DOM 操作的方式。
【问题讨论】:
-
我会先通过 HTML Purifier 运行格式错误的 HTML,然后再对其进行任何操作。