【发布时间】:2012-03-30 06:00:43
【问题描述】:
我已经使用了一些 Tesseract,但它的结果还有很多不足之处。我目前正在检测非常小的图像(35x15,无边框,但尝试使用 imagemagick 添加一个没有 ocr 优势的图像);它们的范围从 2 个字符到 5 个字符,是一种非常可靠的字体,但是这些字符的可变性足以让简单地使用图像大小校验和之类的东西是行不通的。
除了坚持使用 Tesseract 或对其进行完整的自定义培训之外,OCR 还有哪些选择?此外,如果这与 Heroku 风格的托管兼容(至少我可以编译的地方),那将非常有帮助把垃圾箱推过去)。
【问题讨论】:
标签: php python ruby ocr tesseract