【问题标题】:How to scrape 2 level web page from a website如何从网站上抓取 2 级网页
【发布时间】:2020-01-26 20:51:50
【问题描述】:

我想问你如何使用 python + Beautiful soup 或 Scrapy 抓取网页,其中包含例如工作公告,如果有 2 个级别的页面,一个简短的描述 + 一个链接到工作职位的完整细节?我需要从职位公告的标题中抓取数据,然后更深入地提取完整描述并将该数据添加到数据库或文本文件中?问题将进入完整描述所在的第二级并获得完整的细节,包括图像链接(如果存在)...... 有人做过吗?

提前谢谢你。

【问题讨论】:

  • 提供你要报废的网址?

标签: python sql web-scraping beautifulsoup scrapy


【解决方案1】:

检查:

如果我了解您想要做什么,我会保存您需要的...公司名称、描述、第二个链接等

然后对于每个保存的公司,向 secondLinks 发出请求并保存/设置信息

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2018-05-23
    • 1970-01-01
    • 1970-01-01
    • 2020-03-09
    • 1970-01-01
    • 2016-09-08
    • 2021-06-22
    • 2011-08-02
    相关资源
    最近更新 更多