【问题标题】:C# Custom OCR that returns a formatted string返回格式化字符串的 C# 自定义 OCR
【发布时间】:2012-07-14 08:44:43
【问题描述】:

仅出于我个人的兴趣,我从我的研究中看到,开始自己的 OCR 并不是那么容易。但是,我想听听有关如何实现挑战的想法,不仅要识别字符,还要以格式化字符串的形式返回结果。 例如,我有一张桌子的图像(想象它是一个图像,其中“|”和“_”被画成直线):


|数字,AnotherNumber|一些文字|


|1,4 |废话|


使用静默 OCR 后,我得到的结果为“|Number, AnotherNumber|SomeText|\n|1,4|Blah|” 关于如何实现这一点以及我可以使用哪些可用工具/库的任何想法?我也想用 Visual Studio 2010 用 C# 编写这个。理想情况下可以使用 PDF,但不同的图像格式都可以。我已经看过一些,但它们似乎不兼容,因为它们使用 C++ 或 C。 谢谢你。 阿丽娜。

【问题讨论】:

    标签: c# ocr


    【解决方案1】:

    获取 ocr 库是相当困难的(当然,如果你不想付钱的话) 你可以试试这个,它不是免费的,但如果你有 Office 2007: http://www.codeproject.com/Articles/41709/How-To-Use-Office-2007-OCR-Using-C

    【讨论】:

    • 我面临的唯一技巧是我需要将绘制的线识别为“|”的 OCR表格上的“_”类型的字符。那里有预先煮好的东西吗?或者,如果可以的话,我可以得到一个开放的库并用这样的功能扩展它吗?谢谢。
    • 如果可以的话,我也很乐意从头开始我自己的 OCR。那样的话,什么对我有用?
    猜你喜欢
    • 2018-12-29
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-06-05
    • 2014-07-09
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多