【发布时间】:2021-09-04 07:38:33
【问题描述】:
这里完全是自学成才的菜鸟。我正在使用 Windows 命令提示符来运行 Tesseract-ocr。
我设法找到了正确的命令,以输出一个两层的 pdf 文件,其中包含原始扫描页面但也是可搜索的文本。
tesseract filename.tif output -l ita pdf
对我来说也很简单。 但是,如何在不手动执行的情况下对文件夹中的所有 200 多个 .tif 文件重复此操作?获得尽可能多的输出 pdf 或获得单个输出 pdf 对我来说没有区别。
感谢所有帮助我的人。
【问题讨论】:
-
期望的输出是什么? 200 多个单独的文件还是 1 个文件?