【问题标题】:How to set language in Tess4J using language from mobile device?如何使用移动设备的语言在 Tess4J 中设置语言?
【发布时间】:2018-05-04 13:02:55
【问题描述】:

我正在使用 Web 服务来读取图像文件并使用 Tesseract 返回一些文本。

据我们所知,Tesseract/Tess4j 支持 ISO 639-3 格式的语言输入(即:eng​​strong>、spa deuara 等),但我从移动设备获得的语言格式如下:en-gbpt- br,...

我的用户可以使用任何语言并请求阅读图片。

我的问题是:有人知道如何解决这个问题吗?

还有,如果我没有设置任何语言,它会猜测/找到图像上的语言吗?

【问题讨论】:

  • 为什么不在tess4j中设置语言类型之前先转换一下?

标签: java tesseract tess4j


【解决方案1】:

我的问题是:有人知道如何解决这个问题吗?

使用类似的方法转换/找到正确的语言

    for (Locale locale : Locale.getAvailableLocales()) {
        System.out.println("" + locale
                + "; display: " + locale.getDisplayLanguage()
                + "; name: " + locale.getDisplayName()
                + "; lang: " + locale.getLanguage()
                + "; iso3: " + locale.getISO3Language());
    }

然后就可以在tess4j中设置了。

Ref for the above

还有,如果我没有设置任何语言,它会猜测/找到图像上的语言吗?

我认为应该设置默认值,否则会引发错误。 (没看过源码)

【讨论】:

    猜你喜欢
    • 2021-01-31
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-01-15
    • 2012-10-06
    • 1970-01-01
    • 2022-06-23
    • 1970-01-01
    相关资源
    最近更新 更多