【问题标题】:Can you use MODI OCR to recognize non-language specific items?您可以使用 MODI OCR 识别非语言特定项目吗?
【发布时间】:2011-03-05 20:56:45
【问题描述】:

我已经在图像上进行文档 OCR,当页面上有“咖啡”或“432”之类的词时效果很好,但是当我尝试对“abc123”之类的词进行 OCR 时,我得到一个“OCR运行错误”。

MODI.Document md = new MODI.Document();

md.Create("c:\\temp\\mpk.tiff");

md.OCR(MODI.MiLANGUAGES.miLANG_ENGLISH, true, true);  // <-- Error thrown here
MODI.Image image = (MODI.Image)md.Images[0]; 

FileStream createFile = new FileStream("c:\\temp\\mpk.txt", FileMode.CreateNew);

StreamWriter writeFile = new StreamWriter(createFile);
writeFile.Write(image.Layout.Text);
writeFile.Close();

md.Close();

肯定 MS 没有构建这个库来识别基于语言的单词?还是他们?我是否缺少 MODI.document 设置或其他内容?

任何帮助将不胜感激,

【问题讨论】:

    标签: .net ocr modi


    【解决方案1】:

    是的,他们做到了。如果没有相关的字典和不提供上下文的片段,OCR 会变得非常不准确。人类也是如此:ABC123、ABCI23、ABCl23。三个不同的字符串。这在实践中通过使用特殊字体来解决,最大限度地减少字母和数字模棱两可的可能性,您在银行支票上看到的那种。

    【讨论】:

    • 这真的很不幸,有道理,但我宁愿它猜测每个字母而不是抛出异常。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-01-11
    • 1970-01-01
    • 2020-12-13
    • 1970-01-01
    相关资源
    最近更新 更多