【问题标题】:iOS How to get all words coordinates in PDF pageiOS如何获取PDF页面中的所有单词坐标
【发布时间】:2014-06-12 16:29:08
【问题描述】:

我浏览了许多教程,并且通常将用户堆放在 pdfkitten 的链接上,但我已经对其进行了测试,但我对结果并不满意。所以搜索不适用于乘词等。

所以我要查找的内容需要从 pdf 页面中获取所有单词,并在单词穿过某个矩形时突出显示它。

【问题讨论】:

  • 你能找到解决办法吗?如果是,请将其添加为答案,以便对您有所帮助。谢谢!

标签: ios pdf nsscanner cgpdfdocument cgpdfscanner


【解决方案1】:

我也用过 PDFKitten。

  • 我所做的是在扫描 PDF 时 - 识别分隔的单词 按空格。
  • 保存渲染状态(PDFKitten 代码中的模型)字为 遇到将这个词保存在一个模型中,它是当前的 RenderingState(PDFKitten 代码中的模型)将是初始状态。 当找到完整的单词(空格分隔)再次保存 当前的 RenderingState 作为最终状态。
  • 使用将 RenderingState 转换为实际视图框架的代码 以上初始状态和最终状态,存在于 PDFKitten 中。你可以 请参阅该代码。
  • 将当前媒体框变换应用于帧。
  • 最后不要忘记 将结果帧转换为用户的坐标系。除此以外 你会观察到相反的效果。

【讨论】:

  • 但是PDFKitten的CMap解析有问题。它丢弃了许多映射。您可能需要先解决此问题,以便获得正确的字符映射。
  • 嗨 Swaroop,你能分享你在这里解释的代码吗?
  • 很遗憾没有。它是一个商业应用,所以不能分享代码。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2023-03-11
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2016-05-11
相关资源
最近更新 更多