【问题标题】:How to get the page link from a href="javascript:..."?如何从 href="javascript:..." 获取页面链接?
【发布时间】:2020-09-07 18:51:35
【问题描述】:

我正在使用 Python 进行网页抓取。我需要获取所有搜索结果页面的链接。但是,我发现 href 值不是常规的 html 链接,而是如下所示。我怎样才能获得正确的页面链接?谢谢!

<a href="javascript:showDocumentSearchResult('20','20','en','','0', '10','srt', 'docdt', 'desc');">2</a>

<a href="javascript:showDocumentSearchResult('20','40','en','','0', '10','srt', 'docdt', 'desc');">3</a>

【问题讨论】:

  • 你提到的代码在哪里?
  • 您想看到的链接实际上不是超链接,而是更多的javascript函数。所以你需要selenium 或其他渲染页面的库
  • “2”是href内容吗?如果是,这可能与页码有关。此处需要更多描述。
  • 抱歉没有正确粘贴代码。刚刚编辑了帖子。谢谢。

标签: javascript python href screen-scraping


【解决方案1】:

您需要在 JS 代码中找到 showDocumentSearchResult 函数(尽管它可能位于单独的文件中)。然后知道该函数的作用,如果可能的话,您可以通过 Python 模拟这样的动作。

参见以下示例:https://webscraping.pro/download-a-file-from-a-link-in-python/

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-04-17
    • 1970-01-01
    • 2015-06-18
    • 2016-05-10
    • 2020-03-14
    相关资源
    最近更新 更多