superhin

MHTML即MIME HTML,归档网页,将样式和脚本全部集成到一个文件中。
Chrome Devtools Protcal API中包含了Page.captureSnapshot方法,可以获取到网页的mhtml格式内容。
我们使用Selenium的driver.execute_cdp_cmd()执行该命令后,将结果写入文件即可,示例代码如下。

from selenium import webdriver

driver = webdriver.Chrome()
driver.get(\'https://www.qq.com/\')

# 1. 执行 Chome 开发工具命令,得到mhtml内容
res = driver.execute_cdp_cmd(\'Page.captureSnapshot\', {})

# 2. 写入文件
with open(\'qq.mhtml\', \'w\', newline=\'\') as f:   # 根据5楼的评论,添加newline=\'\'
    f.write(res[\'data\'])

driver.quit()

保存结果,如下图,可以使用浏览器打开。

更多的cdp方法可以参考 (chrome-devtools-protocol)[https://chromedevtools.github.io/devtools-protocol/]

分类:

技术点:

相关文章:

  • 2021-12-05
  • 2021-10-28
  • 2022-01-21
  • 2022-02-16
  • 2022-12-23
  • 2021-09-09
  • 2021-11-19
  • 2022-12-23
猜你喜欢
  • 2021-12-05
  • 2021-05-31
  • 2022-02-14
  • 2022-12-23
  • 2021-05-07
  • 2021-11-27
  • 2021-12-16
相关资源
相似解决方案