【发布时间】:2020-01-05 00:46:27
【问题描述】:
我无法让 tesseract 识别下图中的任何字符:
当我从命令行对此图像运行 tesseract 时,我得到 "Empty page!!" - 也就是说,没有结果 - 返回。根据我对 wiki 提高质量部分的阅读,我认为问题可能在于此图像中的单词不是字典单词。考虑到这一点,我尝试了完全禁用 tesseract 字典(使用 load_system_dawg 和 load_freq_dawg 配置标志)以及使用这些附加词(LAO 和 CAUD)扩充现有字典。这些方法都不起作用。我已经尝试过 tesseract 版本 3、4,并在 Mac 计算机上从源代码构建了版本 5。都给出了相同的结果。
奇怪的是,如果我将该图像中的确切单词输入文字处理器并截取屏幕截图,它就会起作用:生成的图像可以被 tesseract 读取。它正确解析每个字符。这是这张图片:
两张图片的唯一区别是第一张的分辨率/质量略低。那么我是否相信 tesseract 无法识别质量稍差的图像中的字符?我能做些什么来提高图像质量吗?我还缺少什么吗?
提前致谢。
【问题讨论】:
-
尝试使用 PSM 6。
-
PSM 6 成功了!谢谢!
标签: ocr tesseract python-tesseract