【发布时间】:2018-12-26 23:14:01
【问题描述】:
我正在尝试从 PDF 文件中删除某些对象。所有的对象都是这样的:
40 0 obj
<<
/PieceInfo
/Subtype /Form
/Resources
<<
/Font
<<
/Fm1 35 0 R
>>
>>
/Type /XObject
/BBox [0 -22.5 131.05 0]
/Length 601
/Matrix [1 0 0 1 0 0]
>>
stream
. . .
A bunch of compressed gibberish here
. . .
endstream
endobj
我发现在不破坏 PDF 文档的情况下可以删除 obj、stream 和 endstream 之间的内容。
在sed 或awk 中是否有办法查找包含/Form 的行,然后删除上面最近的obj 和下面的stream 之间的所有内容,以及stream 和@987654331 @在它下面,这样最终的结果是这样的:
40 0 obj
stream
endstream
endobj
【问题讨论】: