【问题标题】:Reading image from a pdf file [duplicate]从pdf文件中读取图像[重复]
【发布时间】:2013-08-11 02:03:18
【问题描述】:

我有一个要求,客户将上传一个包含 image/s 的 pdf 文件。我必须阅读该 pdf 文件,从中提取图像,然后将该图像保存到数据库和硬盘中。但我不知道如何使用 Python/Django 代码从 pdf 文件中提取图像。是否有任何可用的 python 库可以从 pdf 文件中读取和提取图像。

提前致谢。

【问题讨论】:

  • 是的,在我问这个问题之前我已经看过那个帖子了。但是那个解决方案对我不起作用。
  • 那么,确切地说,您尝试过什么? (TM)

标签: python django image file pdf


【解决方案1】:

我不确定你是否会为此找到一个 python 库。但是,如果您对外部工具没问题,那么 pdfimages 可以完成这项工作

http://en.wikipedia.org/wiki/Pdfimages

我将它与子流程一起用于我的一个项目。

【讨论】:

  • 是的,'pdfimages' 是一个不错的命令,它对我有用。但图像是 .ppm 格式。我们可以将其保存为 .jpeg 格式。另一件事'pdfimages'正在我的本地机器上工作,即Ubuntu 12.04。但是在服务器上它不工作,它是 Ubuntu 的较低版本。我需要在那里安装 pdfimages 吗?
  • pdfimages 是 poppler-utils 包的一部分。对于 jpeg 尝试 -j 选项(来自手册页),但它有一个警告仅适用于 DCT 图像
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2010-11-29
  • 2011-08-22
  • 1970-01-01
  • 1970-01-01
  • 2013-03-23
  • 1970-01-01
相关资源
最近更新 更多