【发布时间】:2009-10-06 20:20:03
【问题描述】:
我需要从 HTML(XHTML 有效)页面中获取一些内容。我使用 curl 抓取页面并将其存储在内存中。
我尝试了将正则表达式与 PCRE 库一起使用的想法,但是我找不到任何将它与 C 一起使用的示例。然后我继续查看 HTML 解析器,但再次没有一个好的选择。我所能找到的只是一个名为 HTMLparser 的 libxml 文档化模块。
还有其他选择吗?如果没有,那么我已经找到的示例?
【问题讨论】:
-
警告使用正则表达式解析 HTML 的必填链接:stackoverflow.com/questions/1732348/…
-
参考下面的链接,我用libxml2 C库为windows平台写下了整个解决方案。 stackoverflow.com/questions/5465965/…