【发布时间】:2022-06-22 21:51:48
【问题描述】:
我想从这个链接下载 pdf 文件:https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9152778。
按照指令Selenium Webdriver: How to Download a PDF File with Python? 我创建了这样的代码:
url = 'https://ieeexplore.ieee.org/stamp/stamp.jsp?tp=&arnumber=9152778'
options = Options()
options.headless = False
options.add_experimental_option('prefs', {
"download.default_directory": outdir,
"download.prompt_for_download": False,
"download.directory_upgrade": True,
"plugins.always_open_pdf_externally": True,
}
)
chromedriver = driver_path
driver = webdriver.Chrome(chromedriver, options=options)
driver.get(url)
selenium 可以成功打开浏览器。但是它不会下载pdf,而是显示如下页面:
我必须点击打开按钮才能开始下载。 html 也不显示有关按钮的任何信息。
谁能告诉我如何修改代码以从该站点下载 pdf 文件?当从其他站点给出 pdf url 时,脚本没有问题!提前致谢!
【问题讨论】:
标签: selenium selenium-chromedriver web-crawler