【发布时间】:2020-05-30 07:26:42
【问题描述】:
我正在努力抓取网站上文章的链接。但通常当网站加载时它只列出 5 篇文章,然后它需要单击加载更多按钮以显示更多文章列表。 Html 源代码只有前五篇文章的链接。
我使用 selenium python 自动单击加载更多按钮以完全加载包含所有文章列表的网页。
现在的问题是如何提取所有这些文章的链接。
在使用 selenium 完全加载网站后,我尝试使用 driver.page_source 获取 html 源并打印它,但它仍然只有前 5 篇文章的链接。
我想在点击加载更多按钮后获取网页中加载的所有文章的链接。
请有人帮忙提供解决方案。
【问题讨论】:
-
你能提供一个网址吗?
标签: selenium web-scraping