【问题标题】:Jsoup like library for Node.js [closed]类似 Node.js 的 Jsoup 库 [关闭]
【发布时间】:2016-07-12 06:35:28
【问题描述】:

Node.js 是否有任何 API 可以从 URL 和静态 html 获取和查询 html?

我喜欢用 webscrape 做这样的事情:

Document doc = Jsoup.connect("http://en.wikipedia.org/").get();
Elements newsHeadlines = doc.select("#mp-itn b a");

我查看了这个Question 并查看了其中大部分 API,但我没有发现(也许我无法识别)任何如此相似的东西。

【问题讨论】:

    标签: javascript node.js web-crawler jsoup


    【解决方案1】:

    Jsdom 可能就是你想要的https://github.com/tmpvar/jsdom 您可以将它与 jquery 结合使用来查询 dom。这是一个关于我如何在我的一个项目中使用它的示例https://github.com/gabesoft/seryth/blob/master/lib/sanitizer.js 您可能还需要request 从网址https://github.com/request/request 获取html

    【讨论】:

      猜你喜欢
      • 2011-12-25
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-12-02
      • 2011-06-26
      • 1970-01-01
      • 1970-01-01
      • 2012-05-04
      相关资源
      最近更新 更多