如何使用移动设备的语言在 Tess4J 中设置语言？答案

【问题标题】：How to set language in Tess4J using language from mobile device?如何使用移动设备的语言在 Tess4J 中设置语言？
【发布时间】：2018-05-04 13:02:55
【问题描述】：

我正在使用 Web 服务来读取图像文件并使用 Tesseract 返回一些文本。

据我们所知，Tesseract/Tess4j 支持 ISO 639-3 格式的语言输入（即：engstrong>、spa、 deu、ara 等），但我从移动设备获得的语言格式如下：en-gb、pt- br,...

我的用户可以使用任何语言并请求阅读图片。

我的问题是：有人知道如何解决这个问题吗？

还有，如果我没有设置任何语言，它会猜测/找到图像上的语言吗？

【问题讨论】：

为什么不在tess4j中设置语言类型之前先转换一下？

标签： java tesseract tess4j

【解决方案1】：

我的问题是：有人知道如何解决这个问题吗？

使用类似的方法转换/找到正确的语言

    for (Locale locale : Locale.getAvailableLocales()) {
        System.out.println("" + locale
                + "; display: " + locale.getDisplayLanguage()
                + "; name: " + locale.getDisplayName()
                + "; lang: " + locale.getLanguage()
                + "; iso3: " + locale.getISO3Language());
    }

然后就可以在tess4j中设置了。

Ref for the above

还有，如果我没有设置任何语言，它会猜测/找到图像上的语言吗？

我认为应该设置默认值，否则会引发错误。（没看过源码）

【讨论】：