【发布时间】:2012-07-02 21:19:35
【问题描述】:
我使用 Google 的 Tesseract API 创建了一个用于识别文本的基本应用,并将其与我的相机应用集成。它工作正常,但唯一的问题是准确性,因为有时文本被识别为随机字符集,我猜准确性约为 50%。
此外,当它尝试扫描图像中的四个以上单词时,应用会崩溃。
String ocrText = baseApi.getUTF8Text();
baseApi.end();
其中baseApi 是 Tesseract API 类的对象。
我是否需要使用不同的数据结构来保存已识别的文本,或者是否有其他原因导致四个以上的单词无法识别?
【问题讨论】:
-
您所需要的只是更好的 OCR 引擎
标签: java android android-ndk ocr tesseract