【问题标题】:PDF OCR Google cloud vision keep spacingPDF OCR 谷歌云视觉保持间距
【发布时间】:2020-01-27 22:07:47
【问题描述】:

我不知道这是否可行,但我收到的是 PDF 格式的表格。我需要将 PDF 中的文本放在与文件中完全相同的位置,并将其放在我可以解析的文本文档中:

第 4 行 startCharacter 50 endcharacter 60

这会给我该位置的任何文本。

这可能吗?

【问题讨论】:

    标签: google-cloud-vision


    【解决方案1】:

    目前,无法做到这一点。我找到了 Cloud Vision API 的 Feature Request 来获取 PDF 文件并将其导出为可搜索的 PDF,这可能会解决此问题。我建议您订阅功能请求(单击标题旁边的星号),以便获得更多可见性。

    同时,您可以查看documentation on PDFs recognition 进行尝试,看看您是否可以获得所需的行为。

    如果您使用的表单具有确定的格式,您可以通过 API 的 TextAnnotation 响应来解决问题。响应会为您提供文本,以及对文本的其他见解,例如页面、段落等。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-02-18
      • 2018-11-13
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多