通常运行Scrapy爬虫的方法是在工程目录下执行scrapy crawl <spider>命令,而不是直接运行Python脚本,因此无法直接命中断点。执行scrapy命令时实际上是执行了scrapy.cmdline模块,因此在PyCharm中添加一个运行该模块的配置即可。

  1. 点击左上角的"Add Configuration…"
    在PyCharm中调试Scrapy爬虫
  2. 添加一个Python运行配置
    在PyCharm中调试Scrapy爬虫
  3. 点击右边"Script path"后边的三角,选择"Module name",表示要执行一个Python模块,然后输入scrapy.cmdline
    在PyCharm中调试Scrapy爬虫
  4. 然后输入参数crawl <spider>,这里爬虫名是quotes,下面的工作目录选择工程根目录
    在PyCharm中调试Scrapy爬虫
  5. 点击确定,然后按正常方式开始调试即可成功命中断点
    在PyCharm中调试Scrapy爬虫
    在PyCharm中调试Scrapy爬虫

相关文章:

  • 2021-11-30
  • 2022-02-06
  • 2021-09-03
  • 2021-12-22
  • 2022-12-23
  • 2022-02-27
  • 2021-09-16
  • 2021-12-03
猜你喜欢
  • 2022-01-08
  • 2022-02-03
  • 2019-03-28
  • 2021-04-24
  • 2021-05-19
  • 2021-12-12
相关资源
相似解决方案