【发布时间】:2013-09-19 17:31:06
【问题描述】:
在 Web 上找到的大多数 PDF 文件都有压缩且不可读的数据流。是否可以使用 Acrobat 或 Acrobat Distiller 解压缩 PDF 文件的内部内容,让我们可以通过文本编辑器读取源代码?
附:这个问题的灵感来自this 答案,该答案解释了如何使用 GhostScript 完成。
【问题讨论】:
-
您想在编辑器中阅读什么内容?运营商用来画什么?还是文字?
-
@mkl 我想阅读用于绘制矢量图的运算符。
-
虽然我不知道如何使用 Acrobat 来做到这一点(虽然我手头只有 9.5 版),但在使用 iText 的小型 Java 或 .Net 程序中做到这一点相当容易或 iTextSharp 通过阅读 PDF 并重新保存而不压缩,参见。 HelloWorldCompression.java / HelloWorldCompression.cs 中的
decompressPdf方法。