使用 Google Cloud Vision 的 7 段 OCR答案

【问题标题】：7 segment OCR using Google Cloud Vision使用 Google Cloud Vision 的 7 段 OCR
【发布时间】：2016-07-24 07:27:39
【问题描述】：

我正在尝试使用带有 TEXT_DETECTION 的 Google Cloud Vision 来尝试在七段显示器上进行 OCR，但得到的结果非常糟糕，主要是因为它似乎认为它是一种不同的语言。它似乎与之相关的典型语言环境是“zh”或“ja”。

我是否可以向 Cloud Vision 提供可能产生更好结果的具体提示？

例如下面这张图——

产生这个输出--

"locale" : "ja",
...
...
"description" : "ココ\n"

我还尝试通过增加对比度、高斯模糊甚至侵蚀来对图像进行预处理以填充片段之间的空间，但运气不佳。

任何帮助/指针将不胜感激。

【问题讨论】：

您是否检查过 EXIF 方向？我认为 GoogleCloudVisionAPI 的源字段忽略了 EXIF 信息。让我们旋转这张图片，以便在没有 EXIF 信息的情况下正确显示。
也许可以继续尝试执行一些图像处理，然后去除背景噪音，然后推送到图像以在 Google Cloud Vision 上进行 OCR 处理。这应该可以解决问题。

【解决方案1】：

尝试在你的 json 代码中添加这个：

"languageHints": ["en"]

【讨论】：