【发布时间】:2021-08-14 01:42:36
【问题描述】:
所以从scrapy docs 我看到了:
输入处理器一收到就处理提取的数据......输入处理器的结果被收集并保存在 ItemLoader 中。收集完所有数据后,调用 ItemLoader.load_item() 方法填充并获取填充后的 item 对象。那时,使用先前收集的数据(并使用输入处理器处理)调用输出处理器。输出处理器的结果是分配给项目的最终值。
我明白了输入处理器的概念。例如,有一些数据要清理吗?只需通过适当的输入处理器运行它。我不明白的是输出处理器的目的。这在功能上与输入处理器有何不同?您不能在第一个输入处理器中包含您想要的任何数据转换吗?
【问题讨论】:
标签: scrapy