【发布时间】:2019-07-13 05:57:26
【问题描述】:
我正在尝试使用 Python 和 Selenium 编写一个脚本来自动从网站下载文本和音频文件。
网站:https://learn.dict.naver.com/conversation#/korean-en/20190713 (yyyymmdd)
import requests
from time import sleep
from selenium import webdriver
from selenium.webdriver.firefox.options import Options
url = 'https://learn.dict.naver.com/conversation#/korean-en/20190713'
options = Options()
options.headless = True
driver = webdriver.Firefox(options=options, executable_path = 'geckodriver')
driver.get(url)
sleep(3)
driver.find_element_by_class_name('btn_listen').click() #for the first one
音频在点击时播放/加载,但我不知道如何在加载和下载文件时“捕获”文件。
将其复制到浏览器中,会加载一个可以手动下载的音频文件。我想自动下载它(能够动态重命名它的奖励积分)。
我已经尝试了一些 options.set_preference(),但它们似乎主要与要下载的文件有关(即“单击此处下载”按钮),而不仅仅是播放。
谢谢!
【问题讨论】:
标签: javascript python selenium selenium-webdriver web-scraping