【发布时间】:2019-06-22 14:30:28
【问题描述】:
Scrapy 有几个允许处理抓取数据的点/位置:spider、items 和 spider 中间件。但我不明白我应该在哪里做对。我可以在所有这些地方处理一些抓取的数据。你能详细解释一下它们之间的区别吗?
例如:下载器中间件向蜘蛛返回一些数据(数字、短字符串、url、大量HTML、列表等)。我应该在哪里处理它们?我知道该怎么做,但不清楚在哪里做......
【问题讨论】:
标签: python scrapy scrapy-spider scrapy-pipeline