1)安装scrapy

在Anacoda Prompt 中输入:  

 condainstall scrapy 

输入y回车表示允许安装依赖库:y

使用 anacoda 安装scrapy

 

测试scrapy 是否安装成功:

使用 anacoda 安装scrapy

 

完成后,再输入命令查看scrapy 依赖的包:

conda install service_identity

使用 anacoda 安装scrapy

在pycharm 中选中anaconda

使用 anacoda 安装scrapy

 

2)编写第一个 spider

文件名: firstspider.py

import scrapy
class Firstspider(scrapy.Spider):
    name = "quotes"
    start_urls = [
        'http://quotes.toscrape.com/tag/humor/',
    ]
    def parse(self, response):
        for quote in response.css('div.quote'):
            yield {
                'text': quote.css('span.text::text').extract_first(),
                'author': quote.xpath('span/small/text()').extract_first(),
            }
        next_page = response.css('li.next a::attr("href")').extract_first()
        if next_page is not None:
            yield response.follow(next_page, self.parse)

 

在anaconda promt 中执行下面的命令,会看到生成一个json 文件:

scrapy runspider firstspider.py -oquotes.json


相关文章:

  • 2021-04-03
  • 2021-10-01
  • 2021-08-21
  • 2022-02-02
  • 2021-10-07
  • 2022-12-23
  • 2021-11-21
猜你喜欢
  • 2021-10-20
  • 2021-11-08
  • 2022-01-17
  • 2021-04-22
  • 2022-01-03
  • 2021-08-14
  • 2022-12-23
相关资源
相似解决方案