【问题标题】:Amazon Textract vs Amazon Rekognition DetectTextAmazon Textract 与 Amazon Rekognition DetectText
【发布时间】:2019-09-24 06:35:47
【问题描述】:

我如何决定何时使用 Amazon Textract 与 Amazon Rekognition 的 TextDetect 方法?

我的用例是点击手机中的图片并将图像数据转换为文本并存储到 AWS RDS。

【问题讨论】:

  • 接受下面的答案可以帮助其他用户更轻松地找到它!我看到这个问题很多,绿色的“已回答”颜色使用户更有可能偶然发现这个问题。

标签: amazon-web-services amazon-rekognition amazon-textract


【解决方案1】:

在端到端问题解决方面,Textract 的表现会更好,因为它更全面地用于 OCR。如果您只是想从野外拍摄的图片中提取一两行文本,例如街道标志或广告牌(即:不是文档或表格),我建议您使用 Amazon Rekognition。

Amazon Textract 是一项较新的 AWS 服务,旨在为解决文档和 PDF 图像中的 OCR(光学字符识别)问题而专门构建的解决方案。虽然 Rekognition 是一种更通用的计算机视觉服务,但 Textract 具有更多面向 OCR 的调整参数,以优化准确有效地提取文本的过程。

开箱即用,如果您要做的只是检测文本和相关元数据(坐标、角度、置信度值),Rekognition DetectText 方法的性能可能与 Textract 中等效的 analyze_document 方法相似,然而,Textract 提供了进一步的语义结构,有助于文本管理/格式化,抽象出开发人员传统上需要自己编写的其他形式的后处理。

最后,在比较两种 Detect Text 方法的成本时,Textract 的成本(1.50 美元/1k 图像)与 Rekognition(1.00 美元/1k 图像)相比要高一些。

【讨论】:

    【解决方案2】:

    如果图片中有简单的随机文本,则使用 Amazon Rekognition。它会在任何位置查找文本。

    Amazon Textract 旨在将纸质文档转换为有组织的数据。它可能不适用于随机图片(虽然我没有尝试过,所以我不能确定!)。

    【讨论】:

      猜你喜欢
      • 2021-11-01
      • 1970-01-01
      • 1970-01-01
      • 2021-07-13
      • 2021-11-07
      • 1970-01-01
      • 2019-11-01
      • 2021-05-12
      • 1970-01-01
      相关资源
      最近更新 更多