【问题标题】:How to crawl asynchronized content by Java?Java如何抓取异步内容?
【发布时间】:2014-10-28 06:07:54
【问题描述】:

我需要用 Java 抓取一个网站,而它的一部分内容是由 ajax 加载的。有没有人有经验如何获取这些内容?

谢谢!

【问题讨论】:

    标签: java ajax web-crawler


    【解决方案1】:

    您可以使用HtmlUnit。它是一个无头浏览器。

    例如,使用 html 单元,您可以按下页面上的按钮,等待 ajax 加载内容并抓取它。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2012-09-07
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2010-09-07
      • 2012-01-14
      相关资源
      最近更新 更多