【发布时间】:2012-04-05 09:08:15
【问题描述】:
我正在使用 tesseract OCR 引擎为 iPhone 开发一个 OCR 项目。我打算编写以下模块:
- 从 iPhone 相机拍摄图像
- 对图像进行预处理以优化它,以改进 OCR 输出。
- 将 OCR 输出划分为有意义的字段。
- 为 OCR 引擎定义一些规则以忽略任何未定义的字符。
(例如,如果 OCR 输出为
0226s5242,我希望它忽略s字符)
我想开始学习与这些模块相关的主题,我不了解 OCR 相关技术,所以任何建议都会非常有帮助,谢谢。
【问题讨论】:
-
嗨,欢迎来到 Stack Overflow!这里的问题到底是什么?您似乎有一个计划,您坚持其中的哪一部分?你只是问这是否是解决这个问题的好方法?
-
不,我想研究与这些模块相关的主题以实现它们,但我现在不知道它们。
-
本网站面向问答形式,您可以在其中提出特定问题并获得答案。您所问的范围非常大,无法以这种格式合理回答。有关详细信息,请参阅FAQ。