【发布时间】:2020-03-03 06:34:21
【问题描述】:
在从名为 timesjob 的网站上抓取所有内容时,我无法访问该网站的下一页,因为页面国家类中的 href 显示为 href = '#' ,在这里我无法访问此类超链接。所以我无法从所有页面中抓取数据。有没有办法解决获取确切超链接的问题,如果有,请回答。谢谢。 我试图访问的链接是https://www.timesjobs.com/candidate/job-search.html?searchType=personalizedSearch&from=submit&txtKeywords=python&txtLocation=bangalore
【问题讨论】:
-
我刚刚弄清楚了他们的分页系统。他们不使用起始页......他们使用序列变量。像我一样将每页的结果设置为 1000,并将序列设置为您想要的页面。成功后请接受我的回答。谢谢
标签: python web-scraping scrapy