【发布时间】:2011-08-23 04:36:18
【问题描述】:
我正在尝试创建一个简单的工具来解析 html 文件。
具体来说,我需要它从所有div 标签中获取所有name 属性。
我的 HTML 字符串各不相同,我无法控制它,所以如果我尝试使用 xpath,我往往会出错,因为 HTML 不是 100% 正确编写的。
有什么想法吗?
谢谢,
【问题讨论】:
-
如果 HTML 格式错误,请使用
DOMDocument::loadHTML()。这将使 DOM 使用 HTML 解析器模块,该模块可以很好地处理大多数损坏的 HTML,并允许您使用 XPath。
标签: php html-parsing xml-parsing