【发布时间】:2011-09-04 19:56:30
【问题描述】:
由于我必须使用多线程,而我无法用 PHP 很好地解决我想用 Java 编程,不幸的是我找不到一个库可以让我像在 PHP Simple 中一样健壮、快速和轻松地解析 HTML DOM HTML DOM 解析器。您知道 Java 中同样易于使用的替代方法吗?
【问题讨论】:
由于我必须使用多线程,而我无法用 PHP 很好地解决我想用 Java 编程,不幸的是我找不到一个库可以让我像在 PHP Simple 中一样健壮、快速和轻松地解析 HTML DOM HTML DOM 解析器。您知道 Java 中同样易于使用的替代方法吗?
【问题讨论】:
我从 Simple HTML DOM Parser 转到 JSoup,对此我很满意。
【讨论】:
【讨论】:
我已经成功地使用 TagSoup 作为 SAX 解析器来填充 DOM4J 文档,然后我使用 XPath 进行查询。我花了一段时间才弄清楚咒语 - (Scala,但我相信你可以转换):
parserFactory = new org.ccil.cowan.tagsoup.jaxp.SAXFactoryImpl
val reader = new SAXReader(parserFactory.newSAXParser.getXMLReader)
val doc = reader.read(new InputSource(new StringReader(page)))
【讨论】: