【发布时间】:2017-09-22 04:00:00
【问题描述】:
设置
我通过终端 (Mac OS) 中的标准命令将我的数据导出到 .csv 文件,例如
scrapy crawl spider -o spider_ouput.csv
问题
导出新的spider_output.csv 时,Scrapy 会将其附加到现有的spider_output.csv。
我可以想到两种解决方案,
- 命令 Scrapy 覆盖而不是追加
- 命令终端在抓取之前删除现有的
spider_output.csv
我读到(令我惊讶的是)Scrapy 目前isn't able 要做 1。有些人提出了workarounds,但我似乎无法让it 工作。
我找到了解决方案 2 的 answer,但也无法使其正常工作。
有人可以帮助我吗?也许还有第三种我没有想到的解决方案?
【问题讨论】:
标签: python scrapy export overwrite