【发布时间】:2016-02-02 14:53:43
【问题描述】:
我正在尝试使用 jsoup 解析和操作 HTML。它对大多数 URL 都很好,但在某些 URL 上却失败了。例如
这行得通:
Document document = Jsoup.connect("https://www.yahoo.com/politics/time-to-take-sanders-seriously-1342599418519606.html")
.userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.95 Safari/537.11 Firefox/19.0")
.timeout(10*1000)
.get();
这失败了:
Document document = Jsoup.connect("http://www.sciencedaily.com/releases/2016/02/160201215944.htm")
.userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.11 (KHTML, like Gecko) Chrome/23.0.1271.95 Safari/537.11 Firefox/19.0")
.timeout(10*1000)
.get();
我哪里出错了?
谢谢。
【问题讨论】:
-
第二个例子的错误是什么?
-
@sparky 没有错误。什么都没有返回。 luksch 的解释是有道理的
标签: java html-parsing jsoup