【问题标题】:How to Tesseract multiple .tif files?如何 Tesseract 多个 .tif 文件?
【发布时间】:2021-09-04 07:38:33
【问题描述】:

这里完全是自学成才的菜鸟。我正在使用 Windows 命令提示符来运行 Tesseract-ocr。

我设法找到了正确的命令,以输出一个两层的 pdf 文件,其中包含原始扫描页面但也是可搜索的文本。

tesseract filename.tif output -l ita pdf

对我来说也很简单。 但是,如何在不手动执行的情况下对文件夹中的所有 200 多个 .tif 文件重复此操作?获得尽可能多的输出 pdf 或获得单个输出 pdf 对我来说没有区别。

感谢所有帮助我的人。

【问题讨论】:

  • 期望的输出是什么? 200 多个单独的文件还是 1 个文件?

标签: pdf ocr tesseract


【解决方案1】:

同时我找到了一种方法:创建一个包含每个 .tif 文件的所有路径列表的 txt 文件(使用命令 dir/s/b *.tif > listname.txt),然后将其用作 Tesseract 的输入。

也许有更快的方法,但这行得通。

【讨论】:

    猜你喜欢
    • 2012-06-23
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多