【发布时间】:2011-12-16 23:10:28
【问题描述】:
我有一个客户是齿轮和链条等的生产商,他们有一个 200 页的目录,其中主要包括文本、带有数字的表格和大量图表。我必须将内容(保持格式)传输到新网站,并且我已经开始一次传输 1 页数据的过程。这是我正在处理的内容类型的示例:
关于如何自动进行此类转换的任何想法?
【问题讨论】:
我有一个客户是齿轮和链条等的生产商,他们有一个 200 页的目录,其中主要包括文本、带有数字的表格和大量图表。我必须将内容(保持格式)传输到新网站,并且我已经开始一次传输 1 页数据的过程。这是我正在处理的内容类型的示例:
关于如何自动进行此类转换的任何想法?
【问题讨论】:
pdftocairo
是一个转换实用程序,能够将 pdf 内容 按原样 转码,保持精确的布局,多种格式,其中之一是 svg
svg可用于网页、html页面、mozilla浏览器内嵌svg查看器(Explorer需要免费插件Adobe svg查看器)
这可能是最好的解决方案,但是我们需要查看生成的单个 svg 的大小
要转换 svg 中的所有 pdf 页面(看起来与 pdf 页面完全相同) 您需要首先在专用目录中将您的 pdf 拆分为单页(然后移动你的源 pdf 一个目录)
pdftk yourfile.pdf burst && move yourfile.pdf ..
然后递归地使用pdftocairo
for f in *.pdf; do pdftocairo -svg $f; done
如果生成的svg不是太大,可以在网站中使用,否则需要使用
pdftohtml
希望布局保持不变
【讨论】:
我们在http://www.jpedal.org/html_index.php 有一个 PDF2HTML5 工具,它可能满足您的需求。
【讨论】: