【发布时间】:2018-07-17 18:22:37
【问题描述】:
我正在尝试从该网站上抓取所有医院数据。 https://www.german-hospital-directory.com/search/Bundesland/Baden-Wuerttemberg.html.
查看请求后,它会发出表单请求。并且无法通过 scrapy shell
访问并且在响应负载中,它给出了整个 html 内容。如何提取每个医院数据,如 URL、NAME、IMAGE 并遍历所有医院。任何帮助将不胜感激,因为我是scrapy的新手。
我是否需要使用 selenium 或者我可以使用 scrapy 以某种方式实现这一点。
【问题讨论】:
标签: python python-3.x scrapy web-crawler scrapy-spider