【问题标题】:Reading data from scanned forms从扫描的表格中读取数据
【发布时间】:2015-07-10 09:03:27
【问题描述】:

我目前有一个 .NET 4 应用程序,可以从扫描的 PDF/图像中读取条形码数据。我需要扩展此应用程序以从扫描的表单中读取其他类型的数据。例如,要求之一是检查表单上特定位置(X,Y)的输入框是否有阴影/着色。我正在寻找满足此要求的开源库的任何建议。这是 OCR 还是我应该寻找任何图像处理库?

【问题讨论】:

  • 这听起来像是 OMR(光学标记识别),而不是 OCR。

标签: c# .net image-processing ocr


【解决方案1】:

OpenCV 是用于图像处理的最佳开源库,对于 C#,有一个用于 OpenCV 的包装器,名为 EmguCV

下载最新版本的 EmguCV。 here(下载第一个文件)

网上有很多教程。这里有几个:

  1. Copy part of an image
  2. How to cut a sub-part of an image using Emgu CV (or OpenCV)?

OCR 也是图像处理的一部分。但在这种情况下你不需要它。

【讨论】:

  • 我支持这个答案。但是,如果以后您需要从表单中实际读取值并且确实需要 OCR,我推荐 puma.net pumanet.codeplex.com 它是用于 .net 语言的 OCR,并且非常易于使用。
  • 感谢@andrew 分享了这么棒的图书馆。这不是我所知道的
  • 每个人总是将 opencv 与 tessarect 配对,这在您使用 C 或 C++ 时非常有用,但对于 c#(或其他 .net 语言)puma 是目前仅有的免费(BSD 许可)库之一。跨度>
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2023-03-04
  • 2017-04-02
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多