【发布时间】:2016-07-24 07:27:39
【问题描述】:
我正在尝试使用带有 TEXT_DETECTION 的 Google Cloud Vision 来尝试在七段显示器上进行 OCR,但得到的结果非常糟糕,主要是因为它似乎认为它是一种不同的语言。它似乎与之相关的典型语言环境是“zh”或“ja”。
我是否可以向 Cloud Vision 提供可能产生更好结果的具体提示?
产生这个输出--
"locale" : "ja",
...
...
"description" : "ココ\n"
我还尝试通过增加对比度、高斯模糊甚至侵蚀来对图像进行预处理以填充片段之间的空间,但运气不佳。
任何帮助/指针将不胜感激。
【问题讨论】:
-
您是否检查过 EXIF 方向?我认为 GoogleCloudVisionAPI 的源字段忽略了 EXIF 信息。让我们旋转这张图片,以便在没有 EXIF 信息的情况下正确显示。
-
也许可以继续尝试执行一些图像处理,然后去除背景噪音,然后推送到图像以在 Google Cloud Vision 上进行 OCR 处理。这应该可以解决问题。