【问题标题】:Copy text of a PDF file to an NSString将 PDF 文件的文本复制到 NSString
【发布时间】:2013-07-21 19:44:58
【问题描述】:

我想将项目中嵌入的 PDF 文件的文本复制到 NSString。 我试过Zachron's pdfiphone,但它似乎不适用于armv7。我需要它在 armv7 上工作。

我已经阅读了一些 Quartz 框架指南,但我仍然不知道如何使用 Quartz 获取 PDF 的文本。如果您知道解决方案,无论是否使用 Quartz,请写下来。

【问题讨论】:

  • 我所说的“PDF 文本”是指电子书仅包含文本(无图像、无链接等)作为内容。

标签: ios pdf core-graphics


【解决方案1】:

如果您的目标 PDF 不是用 CJK(中文、日文和韩文)编写的,那么您的方法更简单。

  1. 下载 PDFKitten。它有一个示例 PDF 解析器。
  2. 将 PDFKitten 的 PDFCore 部分集成到您的项目中。请注意 PDFKitten 是 pre ARC 代码。因此,您必须将 -fno-objc-arc 设置为所有 PDFKitten 文件。
  3. 在 PDF 中,打印文本运算符为 TJ 和 Tj。
  4. 所以你必须修改 TJ 和 Tj 的回调函数。

如果你必须处理 CJK PDF 文件,你的方法会更复杂。因为很多 CJK PDF 文件都有 CID 编码。 CID 表示字形的字符识别。 PDFKitten 不包括此类处理。您必须将 CID 添加到 UCS2 转换函数。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2011-06-26
    • 1970-01-01
    • 2012-08-12
    • 2018-09-22
    • 1970-01-01
    • 2012-08-11
    • 2018-04-19
    • 2021-06-07
    相关资源
    最近更新 更多