如何从网站上抓取 2 级网页

【问题标题】：How to scrape 2 level web page from a website如何从网站上抓取 2 级网页
【发布时间】：2020-01-26 20:51:50
【问题描述】：

我想问你如何使用 python + Beautiful soup 或 Scrapy 抓取网页，其中包含例如工作公告，如果有 2 个级别的页面，一个简短的描述 + 一个链接到工作职位的完整细节？我需要从职位公告的标题中抓取数据，然后更深入地提取完整描述并将该数据添加到数据库或文本文件中？问题将进入完整描述所在的第二级并获得完整的细节，包括图像链接（如果存在）...... 有人做过吗？

提前谢谢你。

【问题讨论】：

提供你要报废的网址？

标签： python sql web-scraping beautifulsoup scrapy

【解决方案1】：

检查：

如果我了解您想要做什么，我会保存您需要的...公司名称、描述、第二个链接等

然后对于每个保存的公司，向 secondLinks 发出请求并保存/设置信息

【讨论】：

猜你喜欢

1970-01-01
2018-05-23
1970-01-01
1970-01-01
2020-03-09
1970-01-01
2016-09-08
2021-06-22
2011-08-02

相关资源

下载 2021-06-06
下载 2023-01-28
下载 2023-01-14
下载 2021-06-06

最近更新更多

热门标签

Java Python linux javascript Mysql C# Docker 算法前端 SpringBoot Redis Vue spring 设计模式 .net core .net kubernetes c++ 数据库数据结构大数据 js 机器学习微服务 Android Go 程序员面试 JVM ASP.net core 云原生人工智能后端 PHP git CSS golang k8s Nginx Django mybatis 深度学习多线程 React 架构 devops 爬虫云计算 Spring Boot LeetCode