【问题标题】:Read Pdf with C用 C 阅读 Pdf
【发布时间】:2009-04-21 14:43:29
【问题描述】:

我希望能够阅读 pdf 文件的内容。我需要在 Linux 上使用 C 来完成。

我越接近这个是here,但我认为 Haru 只能创建 pdf 并且无法阅读它们(不是 100% 肯定)。

PS:我只需要pdf中的纯文本

【问题讨论】:

    标签: c linux pdf libharu


    【解决方案1】:

    查看libpoppler。我从来没有用它来提取文本,只是查询 PDF 属性。它非常易于使用。

    【讨论】:

    • 我认为 libpoppler 对于我想要的来说太“大”了。它使用 QT 和其他我认为没有必要的东西。
    • Poppler 有用于 glib 和 Qt 的可选前端(以很好地适应它们的对象系统),但不是必需的。
    • 好的!我看到它已经在 Ubuntu 存储库中。我去看看。
    【解决方案2】:

    你需要多好地解析它们? 仅提取字符串应该相对容易,完全准确的渲染更难。 看看 evince 或 ghostscript 的来源?

    这是针对 C++ 的,但可能是理解 PDF 结构的一个很好的起点http://www.codeproject.com/KB/cpp/ExtractPDFText.aspx(抱歉之前的链接错误)

    【讨论】:

    • 我只需要pdf文件中的纯文本。
    【解决方案3】:

    VersyPDF 是另一种可能,虽然我从未使用过。它声称允许您编辑 PDF ...http://versypdf.sybrex-systems-ltd.qarchive.org/

    【讨论】:

      猜你喜欢
      • 2013-11-24
      • 2017-05-27
      • 1970-01-01
      • 2011-06-19
      • 2010-11-23
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多