【发布时间】:2015-11-13 01:35:08
【问题描述】:
如果页面具有无限滚动,我如何在 java 中获取页面的 HTML?我目前正在以这种方式抓取页面:
URL url = new URL(stringUrl);
URLConnection con = url.openConnection();
InputStream in = con.getInputStream();
String encoding = con.getContentEncoding();
encoding = encoding == null ? "UTF-8" : encoding;
String html = IOUtils.toString(in, encoding);
Document document = Jsoup.parse(html);
但它不会返回与页面的无限滚动部分相关的任何内容。如何在 HTML 页面上触发此滚动,以便我的 Jsoup 文档包含此部分?
【问题讨论】:
-
可以给个网址吗
标签: java html jsoup infinite-scroll