【发布时间】:2010-12-25 23:00:42
【问题描述】:
它基本上只使用Times New Roman字体,是一个小矩形(220x86)。文字统一,大小相同,无奇怪字符,AZaz09,八种不同颜色(每行一种)。
有什么简单的方法可以做到这一点吗?
【问题讨论】:
它基本上只使用Times New Roman字体,是一个小矩形(220x86)。文字统一,大小相同,无奇怪字符,AZaz09,八种不同颜色(每行一种)。
有什么简单的方法可以做到这一点吗?
【问题讨论】:
最好的开源 OCR 是 Tesseract。它是可训练的,因此您可以定位新罗马时代,尽管它已经带有类似文本的训练。您可以通过使用os.popen()
【讨论】:
apt-get install tesseract-ocr