【问题标题】:Amazon Textract: How to select 'Raw text' optionAmazon Textract:如何选择“原始文本”选项
【发布时间】:2021-12-29 07:56:22
【问题描述】:

我们正在尝试将 amazon Textract api 集成到我们的 node.js 应用程序中。我们在处理图像时遇到了一些问题,FeatureType 参数。我们需要通过 api 实现以下选项:

我们在 AWS JavaScript 开发工具包中找不到该选项。

导出类型 FeatureType = "TABLES"|"FORMS"|string;

我正在尝试这段代码:

const params = {
            Document: {
                /* required */
                Bytes: Buffer.from(fileData)
            },
            FeatureTypes: [""] // here i'm facing issue, if i pass "TABLES"|"FORMS" it working
        };
        var textract = new AWS.Textract({
            region: awsConfig.awsRegion,
            accessKeyId: awsConfig.awsAccesskeyID,
            secretAccessKey: awsConfig.awsSecretAccessKey
        })
        textract.analyzeDocument(params, (err, data) => {
            console.log(err, data)
            if (err) {
                return resolve(err)
            } else {
                resolve(data)
            }
        })

收到此错误:

InvalidParameterType: Expected params.FeatureTypes[0] to be a string

如果我通过 "TABLES"|"FORMS" 它可以工作,但我需要原始文本选项。

提前致谢

【问题讨论】:

  • 你试过简单地使用FeatureTypes: []吗?
  • @JohnRotenstein 收到此错误“InvalidParameterException: Request has invalid parameters”

标签: amazon-web-services aws-sdk-js amazon-textract


【解决方案1】:

你一直在调用analyzeDocument()函数:

分析输入文档中检测到的项目之间的关系。

它返回各种类型的文本:

'BlockType': 'KEY_VALUE_SET'|'PAGE'|'LINE'|'WORD'|'TABLE'|'CELL'|'SELECTION_ELEMENT',

LINEWORD 块似乎符合您的要求。

另外,还有一个detectDocumentText()函数:

检测输入文档中的文本。 Amazon Textract 可以检测文本行和构成文本行的单词。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2023-01-09
    • 2019-07-09
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多