【发布时间】:2017-05-08 19:26:36
【问题描述】:
我还是 Tesseract OCR 的新手,在我的脚本中使用它后,我发现我尝试从中提取文本的图像的错误率相对较高。我遇到了 Tesseract 培训,据说可以降低您使用的特定字体的错误率。我遇到了一个网站 (http://ocr7.com/),这是一个由 Anyline 提供支持的工具,可以对您指定的字体进行所有培训。所以我收到了一个 .traineddata 文件,但我不太确定如何处理它。任何人都可以解释我必须对这个文件做什么才能让它工作吗?或者我应该只是学习如何以手动方式进行 Tesseract 训练,根据 Anyline 网站,这可能需要一天的工作。提前致谢。
【问题讨论】:
-
@EricGopak 现在您的链接重定向到 anyline.com