【问题标题】:How do I extract image from a pdf file using php [closed]如何使用 php 从 pdf 文件中提取图像 [关闭]
【发布时间】:2010-12-09 00:51:40
【问题描述】:

请问,关于如何在 php 中从 pdf 中提取图像有什么想法吗?

【问题讨论】:

  • 我正在尝试做同样的事情。 PDF 图像按原样存储,所有字节都完好无损。我已经编译了一个开始和结束字节的列表,但缺少一些@dadruid5.wordpress.com/2014/08/21/…。任何完成列表的帮助将不胜感激。如果你看到你需要的文件格式(任何人在这里指导),只需找到幻数和结束字节或流(带修剪)。
  • 还有一件事。在 Linux(CentOS、Fedora、Ubuntu)上,使用 poppler utils 调用(子进程或命令行) pdfimages [-options]

标签: php image pdf extract


【解决方案1】:

看看pdfimages。这是页面上的描述:

Pdfimages 保存来自 Portable 的图像 文档格式 (PDF) 文件为 便携式像素图 (PPM)、便携式位图 (PBM) 或 JPEG 文件。

Pdfimages 读取 PDF 文件,扫描 一页或多页、PDF 文件和 写入一个 PPM、PBM 或 JPEG 文件 每个图像,image-root-nnn.xxx, 其中 nnn 是图像编号,并且 xxx 是图像类型(.ppm、.pbm、 .jpg)。

注意:pdfimages 提取原始图像 PDF 文件中的数据,没有 执行任何额外的 变换。任何旋转,剪裁, PDF完成的颜色反转等 内容流被忽略。

【讨论】:

    【解决方案2】:

    如果您有一个现有的 PDF 文件,我想使用 PHP 从那里提取图像几乎是不可能的,也许您对 C 的运气会更好:您需要反汇编二进制文件,对其进行解码/解压缩/反编译并找到图片存储在哪里,然后复制它。

    如果你只是复制'n'粘贴它会更容易。

    【讨论】:

    • 或许是java。 http://www.jpedal.org/
    • 是的,当然,java,甚至python,但我不知道是否有库。
    【解决方案3】:

    我相信您也可以使用 imagemagic。您可以向它发送命令行参数并在给定您可以提供的坐标的情况下拍摄图片。您将需要安装一些 rpm 等。

    【讨论】:

      【解决方案4】:

      查看PDFLib。他们的 TET 产品就是这样做的。你可以把图片和文字拿出来……唯一不包括的是矢量图。

      【讨论】:

        猜你喜欢
        • 2010-09-30
        • 2010-10-17
        • 1970-01-01
        • 2016-03-16
        • 2012-04-11
        • 1970-01-01
        • 2010-12-05
        • 2013-12-22
        • 1970-01-01
        相关资源
        最近更新 更多