【问题标题】:Is there a way to keep the size of merged pdfs using PyPDF2 to a minimum or reduce the size after merging?有没有办法将使用 PyPDF2 合并的 pdf 的大小保持在最小或在合并后减小大小?
【发布时间】:2019-03-21 07:27:18
【问题描述】:

我已使用此问题答案中详述的方法将水印部署到现有 pdf 文件:How to append PDF pages using PyPDF2

但是,在此合并过程中,根据我部署的水印,pdf 的大小至少会增加一倍,并且通常会增加三倍(参考从大约 10MB 到近 30MB)。我需要使尺寸更接近 pdf 的原始尺寸。

有没有办法在合并过程中实现这一点?或者如果没有,是否有一种方法可以通过 PyPDF2 或任何其他 python 包部署以显着减小文件的大小?

我已经四处搜索,但目前找不到合理的解决方案(除了可能通过 Adob​​e 软件手动减小大小)。不过,这不是一个合适的解决方案,因为我需要减少以实现自动化。

另外,出于兴趣,特别是考虑到水印是原始 pdf 大小的一小部分,为什么文件大小会增加一倍以上?

我在这里没有详细说明任何具体代码(除了通过链接的问题和答案间接地),因为它似乎没有必要。不过,如果需要更多信息,请告诉我!

谢谢!

【问题讨论】:

    标签: python-3.x pdf merge size pypdf2


    【解决方案1】:

    关键问题是,如果您使用 mergePage 为 n 个页面添加水印,则很可能会将 n 个水印页面资源的副本引入到文档中,而不是重复使用 1 个水印副本 n 次。 字体或图像资源的 N 个副本会产生很大的开销。我没有看到在 PyPDF2 中解决这个问题的方法。我的公司 Datalogics 确实提供了PDFOptimizer 产品,该产品可以自动删除冗余资源。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2019-12-05
      • 1970-01-01
      • 2019-08-20
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多