Amazon Textract 与 Amazon Rekognition DetectText答案

【问题标题】：Amazon Textract vs Amazon Rekognition DetectTextAmazon Textract 与 Amazon Rekognition DetectText
【发布时间】：2019-09-24 06:35:47
【问题描述】：

我如何决定何时使用 Amazon Textract 与 Amazon Rekognition 的 TextDetect 方法？

我的用例是点击手机中的图片并将图像数据转换为文本并存储到 AWS RDS。

【问题讨论】：

接受下面的答案可以帮助其他用户更轻松地找到它！我看到这个问题很多，绿色的“已回答”颜色使用户更有可能偶然发现这个问题。

标签： amazon-web-services amazon-rekognition amazon-textract

【解决方案1】：

在端到端问题解决方面，Textract 的表现会更好，因为它更全面地用于 OCR。如果您只是想从野外拍摄的图片中提取一两行文本，例如街道标志或广告牌（即：不是文档或表格），我建议您使用 Amazon Rekognition。

Amazon Textract 是一项较新的 AWS 服务，旨在为解决文档和 PDF 图像中的 OCR（光学字符识别）问题而专门构建的解决方案。虽然 Rekognition 是一种更通用的计算机视觉服务，但 Textract 具有更多面向 OCR 的调整参数，以优化准确有效地提取文本的过程。

开箱即用，如果您要做的只是检测文本和相关元数据（坐标、角度、置信度值），Rekognition DetectText 方法的性能可能与 Textract 中等效的 analyze_document 方法相似，然而，Textract 提供了进一步的语义结构，有助于文本管理/格式化，抽象出开发人员传统上需要自己编写的其他形式的后处理。

最后，在比较两种 Detect Text 方法的成本时，Textract 的成本（1.50 美元/1k 图像）与 Rekognition（1.00 美元/1k 图像）相比要高一些。

【讨论】：

【解决方案2】：

如果图片中有简单的随机文本，则使用 Amazon Rekognition。它会在任何位置查找文本。

Amazon Textract 旨在将纸质文档转换为有组织的数据。它可能不适用于随机图片（虽然我没有尝试过，所以我不能确定！）。

【讨论】：