【问题标题】:is there a way to save this PDF programmatically?有没有办法以编程方式保存此 PDF?
【发布时间】:2021-03-10 13:06:14
【问题描述】:

使用 Delphi 10.1,我在 TWebBrowser 组件中加载了一个 PDF。有没有办法以编程方式保存 PDF,它显示在我的 PDF 插件中?

PDF(嵌入网站)的 URL 是:MSDS-File for Productnr G7126 from Sigma-Aldrich

【问题讨论】:

    标签: html web-scraping delphi-10.1-berlin


    【解决方案1】:

    我认为通过网络抓取(如您所愿)是不可能的,我创建了这段代码,假设可以找到所有 iframe 并下载它,但 url 看起来真的很奇怪(并且它会生成一个错误因为它)

    import requests
    from bs4 import BeautifulSoup
    import urllib
    
    url = "https://www.sigmaaldrich.com/MSDS/MSDS/DisplayMSDSPage.do?country=FR&language=de&productNumber=G7126&brand=SIGMA&PageToGoToURL=https%3A%2F%2Fwww.sigmaaldrich.com%2Fcatalog%2Fsearch%3Fterm%3DG7126%26interface%3DAll_DE%26N%3D0%26mode%3Dmatch%2520partialmax%26lang%3Dde%26region%3DAT%26focus%3Dproduct";
    r = requests.get(url)
    
    if r.status_code == 200:
        s = BeautifulSoup(r.text, "html.parser")
        for e in s.find_all('iframe'):
            urllib.request.urlretrieve(e['src'], 'file.pdf')
    

    【讨论】:

    • 非常感谢您的想法。我从那个(可能的)解决方案中学到了。
    • 您在这里使用哪种语言?
    • 我可以在页面被javascript处理后得到iframe。但是我现在如何通过TWebBrowser 获得 PDF 我的新问题在这里:stackoverflow.com/questions/66583660/…
    • @WalterSchrabmair 即 python
    猜你喜欢
    • 1970-01-01
    • 2013-04-02
    • 2021-08-28
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-10-12
    • 1970-01-01
    • 2021-09-21
    相关资源
    最近更新 更多