【问题标题】:Access DOM embedded PDF in Chrome在 Chrome 中访问 DOM 嵌入的 PDF
【发布时间】:2020-11-01 20:05:43
【问题描述】:

是否可以访问在 Chrome 中打开的嵌入式 PDF 文件的 DOM? 如果只是在 Chrome 中打开 DevTools,则只有 EMBED 标签可见:

但是在 Chrome 中打开的 PDF 文件上有鼠标并右键单击 => 代码视图,然后打开一个完全不同的页面代码:

我可以访问它吗?

提前谢谢你!

【问题讨论】:

    标签: vba selenium pdf dom selenium-chromedriver


    【解决方案1】:

    是的,看起来您在一个页面上有多个文档。它类似于网页设计中的 iFrame。我不确定 100%,因为我无法查看链接。

    但我强烈建议将 PDF 下载为文件,然后使用 ADOBE Pro 的库来抓取或使用 PDF 功能。当您获得 pdf 的直接链接,然后在用户或云 PC 上操作数据时,您消除了时间、页面加载和页面更改的整个方面。

    【讨论】:

    • 谢谢!是的,我同意你的看法,但在我的情况下,这种方法不适合。事实是,示例中指向 PDF 文件的链接仅作为示例,而不是我使用的链接。在我的例子中,它是这样发生的:在网站上,我单击按钮创建一个文件,然后生成 PDF 文件并在 Chrome 窗口中嵌入。尽管每次都会生成一个新的 PDF 文件,但文件链接始终相同。无法捕捉到链接。我在 Chrome 中获得了一个嵌入的 PDF 文档,其中包含如下链接:www.somesite.domain/file
    • 我尝试使用您在另一个主题 (stackoverflow.com/questions/43038325/…) 中提示我的示例保存文件,但最终下载了一个空的 PDF 文件。显然,因为页面上的文件没有直接链接
    • 嗯,可能有一个直接链接,你只需要用 Chrome DevTools 记录网络流量打开页面。您可以在 Chrome 中的 F12 和弹出的新窗口中的网络选项卡上找到它。最终,您将在请求列表中看到一个请求,即 PDF 链接((当您单击网络选项卡时,您可以按 CTRL + F,如果有很多请求并缩小范围,则可以搜索文本)它下来))基本上,会有一个“链接”或标题或查询字符串或cookie,指定网页如何从服务器获取该pdf,尝试找到它&lmk
    猜你喜欢
    • 2012-05-13
    • 2014-09-20
    • 1970-01-01
    • 2016-07-03
    • 1970-01-01
    • 2012-01-09
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多