【问题标题】:Does the font name in Tesseract box/tif filenames matter?Tesseract box/tif 文件名中的字体名称是否重要?
【发布时间】:2017-04-13 22:35:15
【问题描述】:

Tesseract wiki 中,用于训练的带标签的 tif/box 文件文件名的格式为[lang].[fontname].exp[num]fontname 真的会影响培训还是只是为了记账?

在我的特殊情况下,我有大量具有不同字体的文档图像(我不知道其中有哪些字体)。我可以只为我手动标记的每个文档使用eng.idontknow.exp[num],还是会因为某种原因搞砸培训?提前致谢!

【问题讨论】:

    标签: tesseract


    【解决方案1】:

    最好匹配真实字体(以帮助可能的 OCR 后分析),但它可以是任意字体名称。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2014-04-25
      • 1970-01-01
      • 2013-01-20
      • 2020-10-20
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-09-04
      相关资源
      最近更新 更多