【发布时间】:2020-10-17 00:04:44
【问题描述】:
我想使用pytesseract 库进行手写文本识别,以读取平均尺寸为 43 * 45 像素的图像中的数字字符。以下示例图片:
预期结果:
9
1
4
我想从图像中获取单个数字字符。
我在下面尝试过这段代码
import pytesseract
# loop through images
print(pytesseract.image_to_string("text.jpg", config='--psm 10 --oem 3 -c tessedit_char_whitelist=0123456789'))
但真正的结果,我得到的准确率不到 50% 甚至更低,有些数字读得很好,有些数字可以在单个图像中读取 2 个字符,有些则没有。
当我删除-c tessedit_char_whitelist = 0123456789 配置时,我得到字符4、\ 和字母g。
如何让 Pytesseract 将图像视为唯一的单个数字字符,而不是使用仍将文本读取为字母数字的白名单?
PS:我知道 OCR 不能 100% 准确。至少准确率可以提高。
【问题讨论】:
标签: python image-processing ocr tesseract