【问题标题】:Scrapy stats Crawled pages and pages/minScrapy stats 抓取的页面和页面/分钟
【发布时间】:2014-10-08 02:14:31
【问题描述】:

有人可以帮我理解scrapy stats。 我正在尝试优化 aws 实例的抓取速度。 我目前的scrapy爬取速度是INFO: Crawled 32429 pages (at 72 pages/min), scraped 197 items (at 0 items/min)
如果 scrapy 以 72 页/分钟的速度爬行,那么 32429 页是什么?绝对不是 32429 页/秒...

【问题讨论】:

    标签: web-scraping scrapy


    【解决方案1】:

    Crawled X pages 是 Scrapy 在抓取时收到的 HTTP 响应的总量。

    仅供参考,logstats module 负责您在控制台上看到的报告。

    【讨论】:

    • 哦,总页数! TY
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-02-15
    • 1970-01-01
    相关资源
    最近更新 更多