【问题标题】:What files should be included in the tessdata folder after training tesseract?训练 tesseract 后应该在 tessdata 文件夹中包含哪些文件?
【发布时间】:2012-07-25 08:01:17
【问题描述】:

我正在使用 tesseract 作为我的 ANPR 应用程序的 OCR 引擎。我已经用车牌字体训练了 tesseract 3.01v。但我需要知道:

  1. tessdata 文件夹中应包含哪些文件?
  2. 我应该使用安装 tesseract 3.01v 的同一个 tessdata 文件夹吗?
  3. 我已经使用 tesseract 3.01v 进行了培训,并且我在我的代码中使用了 tessnet2,所以会不会有问题?

以下是我尝试过的代码,但它不断退出 DoOcr() 方法。

List<tessnet2.Word> ocrText = new List<tessnet2.Word>();
tessnet2.Tesseract ocr = new tessnet2.Tesseract();
ocr.Init(@"C:\Program Files (x86)\Tesseract-OCR\tessdata", "eng", true);
ocrText = ocr.DoOCR(bmpGrayScale, new Rectangle(rect.X, rect.Y, rect.Width, rect.Height));

foreach (tessnet2.Word word in ocrText)
Console.WriteLine("{0} : {1}", word.Confidence, word.Text);

有人知道出了什么问题吗?

【问题讨论】:

    标签: c# image-processing ocr tesseract tessnet2


    【解决方案1】:

    “3.01不向后兼容2.04,数据文件不同。”

    http://code.google.com/p/tesseract-ocr/wiki/ReadMe

    对于兼容 3.01 的 .NET 库,请查看 http://code.google.com/p/tesseractdotnet/https://github.com/charlesw/tesseract-ocr-dotnet 的项目。

    【讨论】:

    • 那我该怎么办呢?你能说得具体一点吗?
    • 如果你为 3.01 训练,那么你必须使用 3.0x 引擎的结果数据。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2010-11-16
    • 1970-01-01
    • 1970-01-01
    • 2012-06-11
    相关资源
    最近更新 更多