【发布时间】:2021-04-15 22:39:50
【问题描述】:
我正在尝试使用 textract 读取附加的 pdf 文件,但它没有将复选框读取为键值对字段。它只是将它们作为原始数据读取。例如,我对第 3 页上的问题 10a 的价值感兴趣。我期望键是“ 10a. Per: (Choose only one)*”,值是复选框单击值。但它仅将其作为原始文本阅读,我无法找到 10a 是单击还是未单击。
以前有人遇到过这个问题吗?可以告诉我吗
我已附上 AWS 文本图像截图和 PDF 链接
【问题讨论】:
-
你找到答案了吗?我很久以前就有这个问题。 Textract 确实有一种检测选中字段的方法。
-
还没有,你还有其他解决方案#Ninad
标签: amazon-web-services pdf checkbox amazon-textract