【发布时间】:2011-07-09 20:23:06
【问题描述】:
使用 Node.js 抓取网站内容的好处是。我想构建一个非常非常快的东西,可以以kayak.com 的风格执行搜索,其中一个查询被分派到几个不同的站点,结果被抓取,并在它们可用时返回给客户端。
让我们假设这个脚本应该只提供 JSON 格式的结果,我们可以直接在浏览器或其他 Web 应用程序中处理它们。
几个起点:
Using node.js and jquery to scrape websites
有人有什么想法吗?
【问题讨论】:
-
我觉得你的第二个链接回答了你自己的问题
-
@sirhc - node.io 看起来像正是我正在寻找的...谢谢!
-
作为 node.io 的作者,我可以保证这一点;)
标签: javascript jquery node.js screen-scraping web-scraping