【发布时间】:2019-07-09 05:04:48
【问题描述】:
我是scrapy的新手。我正在尝试为我正在从事的项目抓取 Indeed 的工作网站。我正在慢慢学习如何使用 google chrome inspect 抓取然后按 control-f 的语法。我跟着本教程学习:
https://www.digitalocean.com/community/tutorials/how-to-crawl-a-web-page-with-scrapy-and-python-3
我基本上无法获得每页 16 个列表。我可以看到它通常以“
//span[@class="company"]/a/text()
到目前为止,这是我的代码:
import scrapy
class IndeedSpider(scrapy.Spider):
name='indeed_jobs'
start_urls = ['https://www.indeed.com/jobs?q=software%20engineer&l=Portland%2C%20OR']
def parse(self, response):
SET_SELECTOR = '.jobsearch-SerpJobCard'
for jobListing in response.css(SET_SELECTOR):
pass
这没有返回任何内容。我希望有 16 行,所以我的 SET_SELECTOR 不正确。非常感谢您的帮助!
【问题讨论】:
标签: python web-scraping scrapy css-selectors