【发布时间】:2014-01-30 21:08:25
【问题描述】:
我正在开发一个 tess4J 项目并使用 tess4j,我已经获得了图像中单词的坐标。唯一的问题是,这些是 TIFF 图像的坐标。我的项目涉及在 pdf 文档中的图像上写一层文本。我认为pdf文档的分辨率是72dpi。所以坐标被变形并且放置得太宽了。如果我可以将分辨率从 300 dpi 降低到 72dpi,然后将图像传递给 tessaract,我不会得到我需要的坐标吗?如果没有,还有其他选择吗?已经尝试将坐标乘以 300/72。令人惊讶的是,这不起作用。
提前致谢!
【问题讨论】:
-
为什么不将坐标从 72dpi 映射到 300dpi 空间(只需将它们乘以 72/300)?
-
没有尝试过...此外我需要将坐标从 300 dpi 映射到 72 dpi 空间。我已经尝试将 x 和 y 坐标乘以 300/72。不工作。
-
您认为 PDF 始终为 72 dpi 的假设可能不正确。
-
但这不是 adobe 规范吗?
-
那么我如何找出 ODF 的 dpi?
标签: coordinates image-resizing tesseract dpi