【问题标题】:tesseract ocr command line for signe character用于符号字符的 tesseract ocr 命令行
【发布时间】:2015-01-27 11:02:47
【问题描述】:

我正在尝试在此图像上运行 tesseract-ocr,但未成功:

> wget http://i.imgur.com/dOtlrvx.png
...
> convert dOtlrvx.png dOtlrvx.tif
> tesseract dOtlrvx.tif out -psm 10 && cat out.txt
Tesseract Open Source OCR Engine v3.02 with Leptonica
Page 0
.

识别的字符是一个点“。”

-psm 10 代表“将图像视为单个字符”,因此我认为它是正确的选择。我也尝试了其他 psm 可能的值,它也不起作用。

任何人都知道为什么这不起作用?欢迎任何建议!

谢谢

【问题讨论】:

    标签: command-line ocr tesseract


    【解决方案1】:

    为 tesseract 创建一个新的配置文件,添加这一行 tessedit_char_whitelist 0123456789 然后处理您的图像:tesseract dOtlrvx.tif out -psm 10 your_config_file

    这对我有用。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2019-07-15
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2015-01-13
      • 1970-01-01
      • 1970-01-01
      • 2018-01-19
      相关资源
      最近更新 更多