【发布时间】:2014-01-14 10:29:18
【问题描述】:
我使用 linux 函数将 PDF 文件列表转换为文本。
命令:
pdftotext -htmlmeta
这适用于我的大多数文件。
但对于其中的一小部分,这会返回一个空白文本文件。
我未成功的完整 pdf 文件未加密,未通过用户/密码保护,也不是只读的。
【问题讨论】:
-
对于那些出于不同原因发现此问题的人:
pdftotext file.pdf不会输出到stdout,它会将 .txt 保存在与 pdf 文件相同的目录中。要转储到stdout,请使用pdftotext file.pdf -