【问题标题】:Real TIme Image Processing (OCR) [closed]实时图像处理(OCR)[关闭]
【发布时间】:2013-03-17 09:14:56
【问题描述】:

我正计划开发像Word Lens 这样的应用程序。有人可以推荐一个我可以使用的好图书馆吗?或任何人解释 Word Lens 应用程序背后的技术?是卷轴时间图像匹配还是 OCR?我知道一些图像处理库,如 OpenCv、tesseract...非常感谢您的帮助...

【问题讨论】:

    标签: iphone ios image-processing ocr augmented-reality


    【解决方案1】:

    我是 Word Lens 的创建者之一。虽然有一些 OCR 库(如 tesseract),但我们决定自己制作,以获得更好的结果和性能。我们的一般算法是这样的:

    1. 从相机复制图像并获取其灰度分量
    2. 平整图像,使文本在背景中清晰突出
    3. 在看起来像字符和句子的事物周围画框
    4. 进行 OCR:将每个框中的像素与字符数据库进行匹配——这实际上非常困难!
    5. 将字符收集成单词,查字典(这也很难,因为OCR会出错)
    6. 将结果重新绘制到图像上

    图像匹配本身不够好,因为字体、单词和语言种类繁多。

    OpenCV 是一个很好的库,可以启动和运行,并且可以了解更多关于计算机视觉的一般知识。我建议建立他们的例子,并在那里玩。玩得开心!

    【讨论】:

    • 以某种方式结合 4 和 5 会得到更好的结果吗?作为 OCR 的局外人,在我看来,您丢失了“5”的信息,这在困难的情况下可能有用。
    • 马丁:完全正确;例如,“O”与“0”非常相似,甚至与“8”和“B”非常相似,因此它有助于保留可能性列表,然后在有更多消歧信息可用时在以下阶段将其缩减(一种简单的反馈)
    • @jd。感谢您的评论.. 我可以知道您创建 Word Lens 需要多长时间吗?你能推荐一些好的 OCR 教程吗?
    • Word Lens 花了两个人大约两年的时间(大约)制作。除了建议您构建原型之外,我想不出很多好的教程。如果您可以让基本系统快速运行,那么当您进行更多研究时,您将准备好提出正确的问题。
    • @jd。谢谢..我会在构建原型后回来...请您通过 gmail 连接我吗?我的 id 是 2arshu@gmail.com?
    猜你喜欢
    • 1970-01-01
    • 2015-09-07
    • 2016-03-10
    • 2010-11-10
    • 2010-11-17
    • 1970-01-01
    • 1970-01-01
    • 2019-01-12
    • 2014-10-07
    相关资源
    最近更新 更多