【发布时间】:2020-01-27 22:07:47
【问题描述】:
我不知道这是否可行,但我收到的是 PDF 格式的表格。我需要将 PDF 中的文本放在与文件中完全相同的位置,并将其放在我可以解析的文本文档中:
第 4 行 startCharacter 50 endcharacter 60
这会给我该位置的任何文本。
这可能吗?
【问题讨论】:
我不知道这是否可行,但我收到的是 PDF 格式的表格。我需要将 PDF 中的文本放在与文件中完全相同的位置,并将其放在我可以解析的文本文档中:
第 4 行 startCharacter 50 endcharacter 60
这会给我该位置的任何文本。
这可能吗?
【问题讨论】:
目前,无法做到这一点。我找到了 Cloud Vision API 的 Feature Request 来获取 PDF 文件并将其导出为可搜索的 PDF,这可能会解决此问题。我建议您订阅功能请求(单击标题旁边的星号),以便获得更多可见性。
同时,您可以查看documentation on PDFs recognition 进行尝试,看看您是否可以获得所需的行为。
如果您使用的表单具有确定的格式,您可以通过 API 的 TextAnnotation 响应来解决问题。响应会为您提供文本,以及对文本的其他见解,例如页面、段落等。
【讨论】: