【发布时间】:2019-04-17 00:32:15
【问题描述】:
我正在尝试识别验证码中的文本,但这对我来说是不可能的。我正在使用 python3、openCv 和 tesseract。
简化代码为:
import cv2
from pytesseract import *
img_path = "path"
img = cv2.imread(img_path)
img = cv2.resize(img, None, fx=2, fy=2, interpolation=cv2.INTER_LINEAR)
img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
pytesseract.image_to_string(img)
我想我应该先去掉颜色线,然后再不理会文字,也许可以改变亮度和对比度。可以应用什么过滤器?
这些是一些要识别的图像。
【问题讨论】:
-
在我看来,CAPTCHA 工作正常。
-
当然不能,你认为他们为什么发明 CAPTCHA?
标签: python python-3.x opencv tesseract python-tesseract