【问题标题】:Image Conversion library: Word, PDF, Excel to Images图像转换库:Word、PDF、Excel 到图像
【发布时间】:2016-06-03 02:58:31
【问题描述】:

我们需要将任何传入的 Excel、PDF 和 Word 文档转换为图像。有什么推荐吗?

我不确定 ImageMagik 是否会这样做,但我的理解是它仅用于图像的格式转换,我猜它也可以处理 PDF。 Excel 和 Word 呢?

提前致谢

【问题讨论】:

    标签: image image-processing


    【解决方案1】:

    您可以先使用以下方法将所有内容转换为 pdf:

    $ libreoffice --headless --invisible --convert-to pdf *.libreofficeextension

    然后使用 imagemagick...

    您可能在 word 中遇到一些格式问题,尤其是在 powerpoint 中

    【讨论】:

    • 如果你有一个 libreoffice 的 gui 实例正在运行,这将不起作用。
    【解决方案2】:

    你说得对——imagemagick 不会处理 MS Office 格式,因为它只处理图像格式转换。

    对于PDF,可以直接使用imagemagick:

    convert -density 400 filename.pdf filename.jpeg
    

    它会给你文件:

    • 文件名[0].jpg
    • 文件名[2].jpg
    • ...
    • 文件名[N-1].jpg

    其中 N 是文档中的页数。 pdf2ps 将实现相同的效果,但您需要使用命令行参数才能获得相同的输出质量。

    对于 MS Office 产品,我记得有某种 API 可让您访问套件的功能(这是 MS Office 2007,凭记忆),例如打开文件并将其导出为 PDF。如果您可以将内容转换为 PDF,则可以使用上述方法将其转换为图像。一些负面的观点:

    • 这是多年前我以前的工作,我不记得它到底叫什么或如何使用它。
    • 我记得输出的 PDF 格式不是很好(不是 100% 像屏幕上显示的那样),但它可读。自从我上次使用它以来,这可能已经有所改善。
    • 我模糊记得它在后台启动了一个 Excel 窗口,因此它不完全是命令行解决方案(可能不适合服务器)

    【讨论】:

    • 我知道可以进行这种 MS-Office 转换 ti 图像,但我仍在研究一种方法。我们需要几乎即时将 MS-office 文档转换为图像,因此需要 API。
    【解决方案3】:

    相当老的问题仍然是我解决的方法:

    1. 使用 Windows 机器
    2. 安装 MS Office 套装
    3. 使用https://officetopdf.codeplex.com/ 将任何办公格式转换为PDF
    4. 使用 Imagemagick 将 pdf 转换为图像格式。

    希望对某人有所帮助。

    【讨论】:

    • 不是我...我只是在制作reviews 和其他人一样
    猜你喜欢
    • 2017-04-21
    • 1970-01-01
    • 2011-04-14
    • 2013-10-25
    • 2011-09-03
    • 1970-01-01
    • 2012-09-20
    • 2011-09-30
    相关资源
    最近更新 更多