【问题标题】:need to download a PDF using python selenium需要使用 python selenium 下载 PDF
【发布时间】:2017-12-29 09:16:27
【问题描述】:

我正在尝试在 python 中使用 Selenium Webdriver 自动下载 PDF

但问题是下载按钮隐藏在 HTML 的嵌入标签中

<embed width="100%" height="100%" name="plugin" id="plugin" src="www.abc.com/123.pdf" type="application/pdf" internalinstanceid="4" title="">

页面会是这样的page view before download button view

如果我将鼠标移到 PDF 的顶部

after i move the mouse button over the top of the PDF

我需要单击下载按钮,但是当我尝试通过单击 f12 来检查其元素时,该元素起初不可见,但是当我通过右键单击该元素来检查该元素时,它将加载新的单独的 HTML 文档,所以我不知道如何处理该 HTML 任何想法都会很有帮助。

【问题讨论】:

  • &lt;embed&gt; 标签中看起来不像WebElementhidden。你如何得出结论?请分享您的代码试验和相关的 HTML。
  • 很抱歉,如果我不够清楚,嵌入不会隐藏,如果您看到第二个屏幕截图,左上角有下载按钮,如果我从页面中按 F12,该按钮的元素被隐藏只有当我右键单击该下载按钮并单击该按钮的检查时,它才会显示该按钮的元素

标签: javascript python html selenium pdf


【解决方案1】:

你为什么要使用 Selenium?

使用 Requests 既简单又高效。

import requests
url='https://www.cs.uky.edu/~keen/115/Haltermanpythonbook.pdf'
page = requests.get(url) # get url

name = url.split('/')[-1] # to get filename
f = open(name,'wb')  # make a file object

f.write(page.content) # write data
f.close()

这使您可以灵活地在任何地方下载,并且比 selenium 快得多。

【讨论】:

    猜你喜欢
    • 2020-08-04
    • 1970-01-01
    • 2019-05-28
    • 2021-11-16
    • 2019-04-12
    • 2012-09-16
    • 2021-11-09
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多