【发布时间】:2026-01-04 22:45:01
【问题描述】:
我正在使用 Scrapy 抓取网站并将数据提取到 json 文件中,但我发现对于某些网站,抓取工具需要很长时间才能抓取完整的网站。
我的问题是:我怎样才能最大限度地减少抓取时间?
【问题讨论】:
我正在使用 Scrapy 抓取网站并将数据提取到 json 文件中,但我发现对于某些网站,抓取工具需要很长时间才能抓取完整的网站。
我的问题是:我怎样才能最大限度地减少抓取时间?
【问题讨论】:
尝试调整CONCURRENT_ITEMS、CONCURRENT_REQUESTS、CONCURRENT_REQUESTS_PER_DOMAIN 和其他设置。
有关设置的完整列表,请参阅http://doc.scrapy.org/en/latest/topics/settings.html
【讨论】: