【问题标题】:Converting PDF to HTML [duplicate]将 PDF 转换为 HTML [重复]
【发布时间】:2012-01-16 22:38:01
【问题描述】:

可能重复:
Convert PDF to HTML

我需要将以 PDF 格式上传的简历转换为 HTML。我已经在使用 livedocx.com 转换 doc 和 docx 格式,但它们不支持从 PDF 转换。我已经阅读了有关此问题的堆栈溢出的其他帖子,标准解决方案是安装 pdf2html 命令行工具。但是,这不是我的选择,因为这是我不是管理员的共享托管服务器。主机不会通过安装该工具来帮助我,因此我需要第三方服务或使用原生 PHP 的干净方法来完成此操作。 PHP 版本是 5.2,在最新的 CentOS 上运行。请帮忙!

克里斯

【问题讨论】:

标签: php html pdf


【解决方案1】:

CentOS 应该默认安装 pdftohtml。这就是要使用的工具。如果由于某种原因您的托管服务提供商已将其删除,那么您需要重新安装它。最好的办法是通过 os 的包管理器安装它。如果您有 ssh 访问权限,请使用以下命令登录并安装:

yum install poppler-utils

如果您没有 ssh 访问权限并且服务提供商不愿意为您安装它, 猜测唯一的选择是找到一个类似于您用于 doc/docx 的 Web 服务。不知道“好”,但这就是谷歌的目的。

【讨论】:

    【解决方案2】:

    另一个不太优雅的解决方案是使用ghostscript(更可能是预安装的)将 PDF 转换为 PNG 图像,然后显示这些图像。这样做的好处是可以处理更多的 PDF 文件,并且布局将保持完美,但将是所有图像。

    【讨论】:

      猜你喜欢
      • 2011-03-04
      • 2010-09-21
      • 1970-01-01
      • 2013-07-23
      • 2012-12-05
      • 2011-09-02
      • 2010-12-31
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多