【发布时间】:2018-05-04 13:02:55
【问题描述】:
我正在使用 Web 服务来读取图像文件并使用 Tesseract 返回一些文本。
据我们所知,Tesseract/Tess4j 支持 ISO 639-3 格式的语言输入(即:engstrong>、spa、 deu、ara 等),但我从移动设备获得的语言格式如下:en-gb、pt- br,...
我的用户可以使用任何语言并请求阅读图片。
我的问题是:有人知道如何解决这个问题吗?
还有,如果我没有设置任何语言,它会猜测/找到图像上的语言吗?
【问题讨论】:
-
为什么不在tess4j中设置语言类型之前先转换一下?