【发布时间】:2011-07-09 23:19:14
【问题描述】:
我正在使用 Boilerpipe 从 url 中提取文本,使用以下代码:
URL url = new URL("http://www.example.com/some-location/index.html");
String text = ArticleExtractor.INSTANCE.getText(url);
String text 仅包含 html 页面的文本,但我需要从中提取整个 html 代码。
有没有人用过这个库并且知道如何提取 HTML 代码?
您可以查看demo page 了解有关图书馆的更多信息。
【问题讨论】:
标签: java html string url extract