【发布时间】:2015-07-13 04:03:26
【问题描述】:
我有这段代码可以将 PDF 转换为文本文件:
gswin32c -dBATCH -dNOPAUSE -dSAFER -dDELAYBIND -dWRITESYSTEMDICT
-dSIMPLE -sDEVICE=txtwrite -dTextFormat=2 -dFirstPage=1 -dLastPage=1
-sOutputFile=C:\out.txt C:\in.pdf
它几乎可以正常工作,唯一它不保持 PDF 表格格式。
例子:
在 PDF 文件中:
Type From Name Name2 Code Week
Regular 30/03/15 KNOWLES, BEN HOOT KNOWLES, ANGELA 367-739-746 80.00
Regular 30/03/15 RICHARDS, COLE ROBERT HARRIS, BRADIE 401-844-307 108.00
Regular 30/03/15 SKEELS, MATT BISHOP, JASON GREGSON 413-980-291 112.00
将其转换为文本文件后,文本会像这样包装:
Type From Name Name2 Code Week
Regular30/03/15KNOWLES, BENHOOT KNOWLES, ANGELA367-739-74680.00
Regular30/03/15RICHARDS, COLEROBERT HARRIS, BRADIE401-844-307108.00
Regular30/03/15SKEELS, MATTBISHOP, JASON GREGSON413-980-291112.00
我需要它来保持其格式。知道如何保持格式吗?
我在 windows 7 机器上使用Ghostscript gswin32c,版本是 9.16。
另外,我愿意接受其他方式存档的建议。
干杯
【问题讨论】:
标签: pdf ghostscript ghostscriptsharp