【发布时间】:2017-04-13 22:35:15
【问题描述】:
在Tesseract wiki 中,用于训练的带标签的 tif/box 文件文件名的格式为[lang].[fontname].exp[num]。 fontname 真的会影响培训还是只是为了记账?
在我的特殊情况下,我有大量具有不同字体的文档图像(我不知道其中有哪些字体)。我可以只为我手动标记的每个文档使用eng.idontknow.exp[num],还是会因为某种原因搞砸培训?提前致谢!
【问题讨论】:
标签: tesseract