【发布时间】:2011-12-03 16:29:47
【问题描述】:
我知道我应该使用像 php domdocument (http://docs.php.net/manual/en/domdocument.loadhtml.php) 或 tagoup 这样的 html 解析器。
如何使用 php domdocument 提取特定标签之间的文本,例如获取 h1、h2、h3、p、table 之间的文本?看来我只能使用 getelementbytagname 对一个标签执行此操作。
是否有更好的 html 解析器来完成此类任务?或者我将如何遍历 php domdocument?
【问题讨论】:
标签: php regex html-parsing