【发布时间】:2012-06-16 14:01:36
【问题描述】:
我需要获取一些 HTML 网页的值。我只想要input标签的value的值,按名称或id或类过滤(如果也支持XPath)。这是非常简单的事情,因此我正在寻找一个“非复杂”解析器,因为我不想在我的程序中使用大量代码(我曾使用过这样的代码)它必须是免费的、轻便的和快速的。
【问题讨论】:
标签: c html-parsing
我需要获取一些 HTML 网页的值。我只想要input标签的value的值,按名称或id或类过滤(如果也支持XPath)。这是非常简单的事情,因此我正在寻找一个“非复杂”解析器,因为我不想在我的程序中使用大量代码(我曾使用过这样的代码)它必须是免费的、轻便的和快速的。
【问题讨论】:
标签: c html-parsing
您可以使用 libxml2。尽管它的名字包括一个 HTML 解析器 HTML Parser module - libxml2。
我用的是python绑定,速度快,支持XPath。
【讨论】: