如何 Tesseract 多个 .tif 文件？答案

【问题标题】：How to Tesseract multiple .tif files?如何 Tesseract 多个 .tif 文件？
【发布时间】：2021-09-04 07:38:33
【问题描述】：

这里完全是自学成才的菜鸟。我正在使用 Windows 命令提示符来运行 Tesseract-ocr。

我设法找到了正确的命令，以输出一个两层的 pdf 文件，其中包含原始扫描页面但也是可搜索的文本。

tesseract filename.tif output -l ita pdf

对我来说也很简单。但是，如何在不手动执行的情况下对文件夹中的所有 200 多个 .tif 文件重复此操作？获得尽可能多的输出 pdf 或获得单个输出 pdf 对我来说没有区别。

感谢所有帮助我的人。

【问题讨论】：

【解决方案1】：

同时我找到了一种方法：创建一个包含每个 .tif 文件的所有路径列表的 txt 文件（使用命令 dir/s/b *.tif > listname.txt），然后将其用作 Tesseract 的输入。

也许有更快的方法，但这行得通。

【讨论】：