【问题标题】:how to extract openload link from a website using selenium in python如何在python中使用selenium从网站中提取openload链接
【发布时间】:2018-03-03 10:23:26
【问题描述】:

我一直在尝试从网站中提取作为 openload 链接的 src。 src 位于动态加载的 iframe 中。 该网站是“https://www1.fmovies.se/film/daddys-home-2.kk29w”。 现在的问题是 iframe 是动态加载的。所以这是我的代码

from selenium import webdriver
driver=webdriver.Chrome('C:\\Users\\aman krishna\Desktop\\New folder(3)\chromedriver.exe')
driver.get("https://bmovies.to/film/daddys-home-2.kk29w/78vp5j")
driver.find_element_by_xpath("//iframe[contains(@src,'<https://openload.co/embed/qe3n5GZGyGo/?autostart=true')]")

【问题讨论】:

  • 呃,您没有将所有代码复制到问题中吗?
  • 你有一个具体的例子来说明你的问题很好,但是你的例子使用的网站据我所知在绝大多数司法管辖区都是非法的。请选择一些更温和的东西。
  • 检查this answer 是否能够处理动态帧
  • 这不仅仅需要加载页面。这种页面往往会在一段时间内无法完成加载,因此我设置了driver.set_page_load_timeout(15),然后将您的driver.get() 语句包围在try: except: pass 块中以手动限制以防出现问题(或使用ExpectedConditions)。然后用driver.find_element_by_css_selector(或者类似的)点击iframeclose any tabs that might pop up because of ads,等到iframe有src,再获取iframe src。
  • 谢谢你们。我能够通过发送一些点击并获取页面源来做到这一点。

标签: python selenium-webdriver selenium-chromedriver


【解决方案1】:

我可以用勺子喂你代码,因为我用 python 编写了我自己的爬虫,它与你发布的非常相似。但从长远来看,这对您没有帮助。

不过,我会给你一个提示。使用 var box 和 var frames 来获得你需要的东西。

【讨论】:

  • 感谢您的建议。我使用了您的提示并将所有值存储在一个列表中,并通过它迭代以获得我想要的结果。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2021-07-21
  • 2016-04-18
  • 1970-01-01
  • 2020-12-02
  • 1970-01-01
  • 2019-09-01
  • 1970-01-01
相关资源
最近更新 更多