【发布时间】:2022-11-16 12:48:17
【问题描述】:
“=$0”表示标签是最后选择的 Dom 节点,这意味着所有 html 都是稍后通过 javascript 添加的,这使得标签在用漂亮的汤解析它时看起来是空的。 This是我指的网站,我想从<div class = "jw-wrapper jw-reset"> =$0的视频标签中获取src
https://imgur.com/a/F0OSwUR在网页上展示视频标签的证明。
这个 post 问了同样的问题,但是在响应中用户显示了一个 json 结果并告诉我们解析它。但是我不知道如何在我的情况下实现它。
我可以使用 json 结果来获取视频标签吗?如果可以,如何获取?或者我可以使用其他方法吗?
编辑>> 这是我的代码:
DRIVER_PATH = '/path/to/chromedriver'
driver = webdriver.Chrome(options=options, executable_path=DRIVER_PATH)
driver.get("https://mplayer.me/default.php?id=MTc3ODc3")
h1 = driver.find_element(By.TAG_NAME, "video")
print(h1.text)
driver.quit()
输出是 DeprecationWarning: executable_path has been deprecated, 请传入一个Service对象 driver = webdriver.Chrome(选项=选项,executable_path=DRIVER_PATH) [然后是一个空行]
【问题讨论】:
标签: javascript python html web-scraping beautifulsoup