【问题标题】:Google Vision API Text extraction data accuracy (DOCUMENT_TEXT_DETECTION)Google Vision API 文本提取数据准确性 (DOCUMENT_TEXT_DETECTION)
【发布时间】:2018-09-17 10:31:20
【问题描述】:

使用 JAVA SDK for GCP Vision API 进行 OCR(文本提取)。已将功能 TEXT_DETECTION 移至 DOCUMENT_TEXT_DETECTION。我测试的图像名称为“Mohan D”。

  • TEXT_DETECTION:我得到了正确的文本,但没有得到另一个字符
  • 如果我正在使用 DOCUMENT_TEXT_DETECTION,则会获得一个名称为“MOHAND(空间不来)

您能否建议我是否需要使用任何特定选项来获得更高的数据准确性

【问题讨论】:

    标签: google-cloud-platform ocr vision-api


    【解决方案1】:

    Cloud Vision API服务使用的模型一直在改进,以提供更好的识别精度;然而,有时他们把字符弄错了,甚至他们自己都认不出这些字符。请记住,这些服务每天都会接受培训,这意味着识别质量会相应提高。

    基于此,我认为可用的解决方法是遵循files format/sizelanguage 的建议,以及实现服务难以检测到包含在其中的语言时常用的LanguageHints 属性图像,这可能会帮助您提高 OCR 结果的准确性。

    【讨论】:

    • 是的,我正在使用 LanguageHints 属性进行改进,我们是否能够训练 Vision API 是否有任何选项(如果是,请提供帮助)。我已在我的帐户中处理了 50,000 个已识别证明,如果我已更改为客户帐户,则所有这些火车数据都将适用于他们的帐户,否则它将驻留在我的帐户中。
    • Vision API 模型是根据日常使用情况进行训练的,以便在总体上提供更好的识别质量和准确性。这些改进适用于对服务发出的所有请求,无论用于执行呼叫的客户帐户如何,这意味着培训结果将惠及所有使用该服务的用户。请注意,当您使用 Vision API 时,无法训练您自己的模型。
    • 如果您想训练自己的机器学习模型,可以查看AutoML Vision 替代方案;但是,请记住,该产品处于测试阶段,目前功能范围有限,专注于根据您自己定义的标签对图像进行分类。
    猜你喜欢
    • 2019-05-11
    • 1970-01-01
    • 2019-02-25
    • 2020-03-21
    • 2019-02-05
    • 2017-09-27
    • 2020-03-20
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多