【发布时间】:2020-09-07 18:51:35
【问题描述】:
我正在使用 Python 进行网页抓取。我需要获取所有搜索结果页面的链接。但是,我发现 href 值不是常规的 html 链接,而是如下所示。我怎样才能获得正确的页面链接?谢谢!
<a href="javascript:showDocumentSearchResult('20','20','en','','0', '10','srt', 'docdt', 'desc');">2</a>
<a href="javascript:showDocumentSearchResult('20','40','en','','0', '10','srt', 'docdt', 'desc');">3</a>
【问题讨论】:
-
你提到的代码在哪里?
-
您想看到的链接实际上不是超链接,而是更多的javascript函数。所以你需要
selenium或其他渲染页面的库 -
“2”是href内容吗?如果是,这可能与页码有关。此处需要更多描述。
-
抱歉没有正确粘贴代码。刚刚编辑了帖子。谢谢。
标签: javascript python href screen-scraping