【问题标题】:Getting html source code of current active browser window (Python)获取当前活动浏览器窗口的html源代码(Python)
【发布时间】:2021-06-23 07:15:39
【问题描述】:

我想知道是否有可能在我的 windows 机器上获得活动窗口,然后访问 html 页面的源代码。

例如,我打开了 chrome,我想获取我正在查看的页面的当前 html 代码。

仅从 url 获取 html 是行不通的,因为它是一次性生成的 html 页面。

【问题讨论】:

  • 您是否试图通过运行 python 脚本来监控其他人的浏览器活动?由于安全原因,这可能是不可能的。但在另一个线程中,他们声称他们能够使用 python 库获取当前选项卡的 URL。 stackoverflow.com/questions/57900225/…

标签: html python-3.x windows web-scraping


【解决方案1】:

您可以使用Python库selenium获取网页源代码

您需要访问 page_source 属性:

from selenium import webdriver

browser = webdriver.Firefox()
browser.get("http://example.com")

html_source = browser.page_source
if "whatever" in html_source:
    # do something
else:
    # do something else

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2016-06-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2021-05-07
    相关资源
    最近更新 更多