【发布时间】:2014-08-13 20:36:50
【问题描述】:
我希望在 Groovy 中开发一个网络爬虫(使用 Grails 框架和 MongoDB 数据库),它能够爬取网站,创建网站 URL 列表及其资源类型、内容、响应时间和重定向次数涉及。
我正在讨论 JSoup 与 Crawler4j。我已经阅读了他们基本上所做的事情,但我无法清楚地理解两者之间的区别。任何人都可以建议对于上述功能哪个更好?或者将两者进行比较是完全不正确的?
谢谢。
【问题讨论】:
标签: jsoup web-crawler crawler4j