Google Vision API 文本提取数据准确性 (DOCUMENT_TEXT_DETECTION)答案

【问题标题】：Google Vision API Text extraction data accuracy (DOCUMENT_TEXT_DETECTION)Google Vision API 文本提取数据准确性 (DOCUMENT_TEXT_DETECTION)
【发布时间】：2018-09-17 10:31:20
【问题描述】：

使用 JAVA SDK for GCP Vision API 进行 OCR（文本提取）。已将功能 TEXT_DETECTION 移至 DOCUMENT_TEXT_DETECTION。我测试的图像名称为“Mohan D”。

TEXT_DETECTION：我得到了正确的文本，但没有得到另一个字符

如果我正在使用 DOCUMENT_TEXT_DETECTION，则会获得一个名称为“MOHAND（空间不来）

您能否建议我是否需要使用任何特定选项来获得更高的数据准确性

【问题讨论】：

标签： google-cloud-platform ocr vision-api

【解决方案1】：

Cloud Vision API服务使用的模型一直在改进，以提供更好的识别精度；然而，有时他们把字符弄错了，甚至他们自己都认不出这些字符。请记住，这些服务每天都会接受培训，这意味着识别质量会相应提高。

基于此，我认为可用的解决方法是遵循files format/size 和language 的建议，以及实现服务难以检测到包含在其中的语言时常用的LanguageHints 属性图像，这可能会帮助您提高 OCR 结果的准确性。

【讨论】：

是的，我正在使用 LanguageHints 属性进行改进，我们是否能够训练 Vision API 是否有任何选项（如果是，请提供帮助）。我已在我的帐户中处理了 50,000 个已识别证明，如果我已更改为客户帐户，则所有这些火车数据都将适用于他们的帐户，否则它将驻留在我的帐户中。
Vision API 模型是根据日常使用情况进行训练的，以便在总体上提供更好的识别质量和准确性。这些改进适用于对服务发出的所有请求，无论用于执行呼叫的客户帐户如何，这意味着培训结果将惠及所有使用该服务的用户。请注意，当您使用 Vision API 时，无法训练您自己的模型。
如果您想训练自己的机器学习模型，可以查看AutoML Vision 替代方案；但是，请记住，该产品处于测试阶段，目前功能范围有限，专注于根据您自己定义的标签对图像进行分类。