【发布时间】:2020-07-13 12:37:14
【问题描述】:
我的最终目标是从一系列乡村地图中读取土地所有者的姓名并记录位置。有关输入的示例,请参见 here。现在我的想法是使用 Google vision API 来提取文本,然后将文本链接回地图上的原始网格坐标。我使用标准 python 代码从here 中提取此文本。这给我留下了 2 个问题:
1) 我了解 API 仅输出 JSON 文件。此 JSON 是否记录提取文本的 PDF 坐标?
2) 有没有办法将此 JSON 转换为原始的简化可搜索 PDF,其中仅存在文本?
另外,如果有人知道任何更好的方法来 OCR 这张地图并提取字符串位置,我将不胜感激!
【问题讨论】:
标签: json pdf gis ocr google-cloud-vision