【发布时间】:2012-11-22 05:06:28
【问题描述】:
我想抓取几个网站和许多建议Scrapy。它是基于 Python 的,由于我对 PHP 非常熟悉,所以我在寻找替代方案。
我有一个爬虫PHPCrawl。我不确定它是否只是一个爬虫,或者它是否也会提供抓取工具。如果它可以用于抓取——它是否支持 XPath 或正则表达式。
如何与 Python 上的 Scrapy 进行比较。
请建议我最好使用哪个来抓取网站。
谢谢
【问题讨论】:
标签: xpath web-scraping web-crawler scrapy phpcrawl