【发布时间】:2016-06-28 13:36:22
【问题描述】:
我的图像中包含所有数字(PFA 图像)enter image description here,所有数字都没有出现在输出文本中。运行以下代码后我收到的文本是:
75491024385252003967
。我从 https://github.com/tesseract-ocr/langdata
下载了我的训练数据谁能指导我在这里做错了什么?
enter code here
string file = @"C:\Images\image.jpg";
char[] textArray = null;
using (var engine = new TesseractEngine(@"./tessdata", "eng", EngineMode.Default))
{
using (var img = Pix.LoadFromFile(file))
{
using (var page = engine.Process(img))
{
var text = page.GetText();
text = Regex.Replace(text, @"\t|\n|\r|\s", "");
text = text.Trim(' ');
textArray = text.ToCharArray();
}
}
}
【问题讨论】:
标签: c# ocr tesseract text-extraction