【发布时间】:2022-03-07 21:05:07
【问题描述】:
有没有我可以使用的 .dll 文件,它使用 PDF 文件作为输入,HTML 文件作为输出? 我想从 PDF 转换为 HTML。我的同事说,一步一步地从 PDF 中获取文本/字体/图像/边距/链接等,然后创建具有相同内容的新 HTML 文件非常困难。他说这几乎是不可能的。所以我在想 - 如果有一些 dll 可以用作参考吗?
【问题讨论】:
-
这肯定很复杂,但你为什么要它?
-
供应商提供了几种 html 到 pdf 转换器工具,但我没有看到任何 pdf 到 html。由于我不知道完整版可以导出为 html,因此您应该先检查一下并查看结果。那么也许你可以实现一些使用 acrobat 来完成的批处理作业。只是一个想法......
-
网络搜索“将 pdf 转换为 html”将收集许多可能的解决方案。 SO 不是产品建议的好地方,因此投票以“不具建设性”的方式结束。
-
将pdf内容复制到word中,然后另存为html。
-
这些近乎狂热的人将摧毁所以......我会理解这个问题作为重复而被关闭,因为它已被问过几次,但没有建设性?真的??? SO中有成千上万个这样的问题(甚至更糟)被认为是有效的。您现在要关闭所有对解决问题 X 的库的请求吗?