【问题标题】:What's the most reliable way to programmatically control a Chromium instance?以编程方式控制 Chromium 实例的最可靠方法是什么?
【发布时间】:2023-04-03 08:20:01
【问题描述】:

我正在研究以编程方式控制 Chrome/Chromium 实例的可靠方法,以利用其在 Node.js/C#/Java 应用程序中呈现网页的功能。总之,我想做的事情如下:

  • 打开/关闭浏览器窗口。
  • 最小化、最大化浏览器窗口。
  • 导航到某个 URL。
  • 设置 cookie。

为了更清楚:我需要一个 headful 浏览器来向最终用户显示网页。它可以嵌入到我的应用程序中,也可以是独立的浏览器(例如单独发布的 Chromium 实例)。

我无法在 Chrome/Chromium 中找到可以在 Node.js/C#/Java 环境中使用的任何公共 API 的信息。可用于 Chrome 扩展的那些不适用于我的项目,因为我想从外部控制浏览器,例如 Selenium WebDriver。到目前为止,我找到了以下方法来按照我需要的方式控制浏览器:

  1. 使用 Puppeteer/WebDriver API。
  2. 使用 chrome-remote-interface NodeJS 库。
  3. 依靠 Chrome 嵌入式框架功能。
  4. 依靠 Electron.js 功能。
  5. 构建我自己的库,以某种方式将 Chromium 模块作为依赖项包含在内(例如,类似于 Electron 团队实施的)。

从所有提到的最终利用 Chrome Devtools 协议的库的角度来看,前两个选项是相似的。 CDP 被淘汰/弃用的风险对我们的项目来说是相当大的。另一个问题是 CDP 的目的是调试和测试自动化,而不是应用程序开发。此外,在用户机器上打开 Chrome 中的开放调试端口似乎很容易受到攻击。

由于依赖于嵌入式 Chromium 更新节奏,我担心 CEF 和 Electron 路径。尽管 Electron 团队的目标是更新 Chromium 的所有其他版本,但由于无法在带有安全补丁的新版本发布后立即更新 Chromium 版本,它仍然可能是一个安全问题。此外,如果我需要真正的浏览器体验(就是这种情况),我不会开箱即用,我必须自己实现按钮、标签、地址栏等浏览器功能。

选项 #5 的实施似乎极其复杂,因为它似乎需要团队在 Chromium 内部、C++ 开发和 C++ 构建工具方面的能力。

我在选项列表中遗漏了什么?我在假设中遗漏了什么?任何提示,想法,建议将不胜感激!

【问题讨论】:

    标签: electron chromium puppeteer chromium-embedded chrome-devtools-protocol


    【解决方案1】:

    您的一些选项是关于控制浏览器(#1、#2),而其他选项是关于嵌入浏览器(#3、#4)。这是两个不同的用例,您需要什么取决于您的目标。

    控制浏览器

    如果您想控制浏览器执行任务,甚至可能在最终用户不注意的情况下在后台执行,您应该选择选项 1(puppeteer)或 2(chrome-remote-interface)。

    我建议使用 puppeteer,因为这是由 Google Chrome 开发人员开发的库,它为您的用例提供了许多功能(打开浏览器窗口、导航、设置 cookie)。

    我认为没有任何理由担心 Chrome DevTools 协议 很快就会被放弃。 Chrome DevTools 完全依赖这个协议。此外,Firefox (Mozilla bug tracker: #1316741,#1523097) 和 Edge 已经部分支持该协议,使其在未来更不可能被放弃。 (more information)

    嵌入浏览器

    如果您需要嵌入浏览器,即尝试在应用程序中显示浏览器,您应该关注选项 3(Chrome 嵌入式框架)或 4(电子)。

    Chrome Embedded Framework 是一种更底层的方法,可将单独的浏览器放入您的应用程序中。但我不能在这里详细说明,因为我自己从未使用过这个。

    Electron另一方面浏览器,这意味着整个应用程序被开发为Web应用程序。您可以将另一个浏览器窗口 (webview) 嵌入到您的浏览器中,您基本上可以控制它(类似于 puppeteer 可以做的事情)。

    直接使用 Chromium 代码(选项 5)

    虽然 Chromium 项目分为多个组件,但听起来您需要一个完整的浏览器。我曾经自己编译过 Chromium 源代码,它确实需要几个小时。请记住,他的代码包含大约 3500 万行代码 (source)。即使您弄清楚要使用代码的哪些部分,与放弃 DevTools 协议相比,代码的某些低级部分更改并破坏您的实现更为现实。所以,我绝对建议不要遵循这个想法。

    替代品

    根据您的用例,您还可以查看 DOM 模拟库,例如 jsdomcheerio。这些库的功能非常有限,您可能必须自己实现浏览器的某些部分,例如下载文档、读取和设置标题以处理 cookie 等。


    总而言之,如果您想控制浏览器主要在后台执行任务,我建议您选择 puppeteer。如果您需要将浏览器窗口作为应用程序的一部分,请选择 Electron。

    【讨论】:

    • 谢谢!很好的答案,它与我迄今为止能够发现的几乎一致。关于 Chromium 代码编译的注释非常有价值,因为我自己从未接触过它。
    • @MasterDev 很高兴我能帮上忙。如果对您有帮助,请随时 accept the answer
    猜你喜欢
    • 2011-04-19
    • 2010-12-02
    • 2013-03-12
    • 1970-01-01
    • 2015-06-19
    • 2022-06-17
    • 2022-01-17
    • 2010-11-01
    • 1970-01-01
    相关资源
    最近更新 更多