【问题标题】:pdf to html conversion in phpphp中的pdf到html转换
【发布时间】:2010-11-25 20:59:54
【问题描述】:

在我的 php 脚本中,我想将 pdf 文件转换为 html 格式,并且在执行此操作时生成的 html 文件内容不应受到干扰....

我找到了http://sourceforge.net/projects/pdftohtml/,但它是命令行工具,需要 shell 访问权限。第二件事是生成的html文件内容受到干扰..

【问题讨论】:

  • 你已经问过同样的问题了:stackoverflow.com/questions/1383176/…
  • 如果您超越标题,这不是完全相同的问题,但仍然非常混乱。
  • 嘿 Jamie Lewis,请再读一遍这两个问题,两者都不一样。

标签: php pdf


【解决方案1】:

shell命令可以从php执行吗?

$rtn = exec ('CLI Command to execute', $emptyVartoCaptureOutput);

该命令在 shell 中执行,在运行 php 脚本的用户的上下文中运行(_WWW 或类似的脚本从 apache 网络服务器运行)。当您提供第二个可选参数时,命令的所有输出都会被捕获到一个数组中。

看来这可能会解决您的问题。

回应您的评论:

您在原始帖子中引用的工具是您将执行的命令行工具 - 您需要确定要执行的确切命令,包括该命令的所有参数。

我不熟悉您引用的工具,但我怀疑它有多种选择。需要查看的几个重要选项是生成的 html 的去向。我猜它可以转到文件(这将需要 _WWW 对目录具有写入权限,这是一个巨大的安全风险)或标准输出。当您使用 php 中的 exec 命令时,发送到 std out 的任何输出都保存为一个数组,当您向 exec 函数传递一个可选的第二个参数时,每个新行的一个新元素。因此,您应该能够从脚本中动态捕获和操作和/或显示输出的 html。

对于仅显示 pdf 中的 html 的简单 html 页面,您可以执行以下操作:

<std header stuff omitted for brevity>
<?php
$rtn = exec('CLI Command to Execute -a option1 -b option2', $ouputted_html);
foreach ($ouputted_html as $val){
    echo $val . "\n";
}
?>
</body>
</html>

你可以使用 echo implode("\n", $outputted_html);代替 foreach 循环来完成同样的工作,但是如果您选择利用它,foreach 循环允许您对每一行进行一些控制。

请注意,生成的 html 可能包含也可能不包含标题信息,您必须进行试验才能看到。显然,您可以添加标准 html 页面所需的内容,如果已经提供,则可以减去。

因此,您现在有了将 pdf 文件显示为 html 的基础,如果您需要有关该工具复杂性的具体帮助,我建议您寻找专用于该工具的论坛或列表服务,或者向开发人员寻求帮助( s) 在阅读文档和常见问题解答之后。

【讨论】:

  • Scott,可以推荐任何命令行应用程序。提前致谢
  • 您可能会考虑对您认为有帮助的答案进行投票,即使它们没有完全回答您的问题。我将编辑我的原始答案以回复您的评论。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2023-03-28
  • 1970-01-01
  • 1970-01-01
  • 2011-06-23
  • 2019-07-05
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多