【发布时间】:2021-01-08 05:55:07
【问题描述】:
我正在尝试使用 tesseract 识别 python 中的单个数字。
我的代码是这样的:
import numpy as np
from PIL import Image
from PIL import ImageOps
import pytesseract
import cv2
def predict(imageArray):
pytesseract.pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
newImageArray = Image.open(imageArray)
number = pytesseract.image_to_string(newImageArray, lang='eng', config='--psm 10 --oem 1 -c tessedit_char_whitelist=0123456789')
return number
说这是8没有问题
但它不会将此识别为4
我的图片只是数字0-9。
这只是一个这样的例子,在其他情况下它很难识别“明显/清晰”的数字。
目前我对起始图像image 所做的唯一事情就是转换颜色。使用以下内容:
cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
有什么方法可以提高准确性。我所有的图像都是清晰的计算机打印图像,所以我觉得准确度应该比它高很多。
【问题讨论】:
标签: ocr tesseract python-tesseract