【发布时间】:2017-02-25 23:29:55
【问题描述】:
我有一张发票图片,我想检测上面的文字。所以我打算用2个步骤:首先是识别文本区域,然后使用OCR识别文本。
为此,我在 python 中使用 OpenCV 3.0。我能够识别文本(包括一些非文本区域),但我还想从图像中识别文本框(也不包括非文本区域)。
img = cv2.imread('/home/mis/Text_Recognition/bill.jpg')
mser = cv2.MSER_create()
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY) #Converting to GrayScale
gray_img = img.copy()
regions = mser.detectRegions(gray, None)
hulls = [cv2.convexHull(p.reshape(-1, 1, 2)) for p in regions]
cv2.polylines(gray_img, hulls, 1, (0, 0, 255), 2)
cv2.imwrite('/home/mis/Text_Recognition/amit.jpg', gray_img) #Saving
现在,我想识别文本框,并删除/取消识别发票上的任何非文本区域。我是 OpenCV 的新手,也是 Python 的初学者。我可以在MATAB example 和C++ example 中找到一些示例,但是如果我将它们转换为python,我会花费很多时间。
有没有使用 OpenCV 的 python 示例,或者有人可以帮助我吗?
【问题讨论】:
-
嘿,你知道了吗?
标签: python opencv image-processing ocr