【发布时间】:2016-04-06 06:26:03
【问题描述】:
有没有办法让 Tesseract 只匹配用户指定的单词或模式? manual 声称这是可能的,但我无法在互联网上找到一个有文件证明的实例,说明有人正在使用它。
这里有很多人寻求帮助的例子,因为它不起作用,并且没有一个经过验证的解决方案。
stackoverflow.com/questions/33429143/tesseract-user-pattern-is-not-applied
stackoverflow.com/questions/31874393/tesseract-ocr-force-pattern
stackoverflow.com/questions/26856349/provide-pattern-for-tesseract
stackoverflow.com/questions/22432194/tesseract-ocr-only-detect-user-words
stackoverflow.com/questions/17209919/tesseract-user-patterns
groups.google.com/forum/#!topic/tesseract-ocr/S9CIK3jOMWw
groups.google.com/forum/#!topic/tesseract-ocr/5vFqVcJmHnM
那么我们可以断定这个功能根本不起作用吗?有这方面的官方声明吗?
【问题讨论】:
-
许多链接的 Tesseract 文档似乎已移动。 Here 是 github 上手册的链接。
-
一年后,情况似乎仍然如此。
-
手册链接失效
-
Repo 管理员说用户模式在 v3.02 左右出现了问题。 LSTM v4.0 可能破坏了用户模式以及字符白名单github.com/tesseract-ocr/tesseract/issues/960