【发布时间】:2019-02-17 08:44:27
【问题描述】:
正如标题所暗示的,我想使用 Python 通过提交按钮下载文件。 在我的示例中,它是来自 Wikipedia 的 pdf 文件。
很容易找到有关如何从以 .png 或其他内容结尾的 URL 下载文件的答案。不过,我无法找到很多关于我的具体问题的信息。
示例页面类似于this。
通过单击按钮开始下载并将文件保存到您的下载文件夹中。
如何用 Python 实现这个过程?我尝试了不同的包,如requests、bs4 或urllib。
我不想通过使用 pyautogui 或通过使用按钮在屏幕上的位置来“单击”按钮来解决问题,我宁愿有一个能够在后台操作的解决方案。
感谢您的帮助
【问题讨论】:
-
Selenium 网络驱动程序可能是你最好的选择
-
我找到了解决问题的方法。使用 chrome 开发人员工具,我能够查看您在提交时被重定向到的 URL(单击按钮)。这表示我能够理解 URL 结构,通常只使用基本的 ASCII (%) 编码。我想我明天会完成我的代码。如果有人出于测试目的或其他目的对此感兴趣,我可以将其发布在这里 ofc。现在,如果您想自己调查,我可以发布 pdf 的 URL:de.wikipedia.org/api/rest_v1/page/pdf
标签: python-3.x web-scraping automation beautifulsoup python-requests