【问题标题】:To convert docs into HTML将文档转换为 HTML
【发布时间】:2015-02-26 17:56:33
【问题描述】:

我们正在开发一个 Java 项目,要求是我们需要一个用于普通办公文档的 HTML 转换器,它将文档转换为 HTML。此外,我们需要在查看器中显示这些 html 页面。

我有很多解决方案,但有些只转换为 doc,有些只转换为 docx,我需要一个解决方案来将 doc、docx 和其他文档转换器转换为 HTML。

【问题讨论】:

  • 有什么理由不使用 PDF 吗?
  • 我只需要在 HTML Viewer 中显示文档,如果可以将所有类型的文档转换为 PDF 然后再转换为 PDF 就可以了。
  • "HTML 查看器" - 你是指浏览器吗?浏览器有 PDF 插件。 - “HTML 查看器”有什么特别之处?

标签: java html converter document


【解决方案1】:

看看 Apache POI,有一堆转换类。

Link to the POI

【讨论】:

    【解决方案2】:

    您可以通过 Libre Office 命令行获取它...

    "'C:/Program Files/LibreOffice 4/program/soffice.exe' --headless --convert-to html --outdir converted/ 'uploads/filename.doc'");
    

    这里C:/Program Files/LibreOffice 4/program/soffice.exe是可执行文件的路径...

    您可以从此链接下载 Libre Office...

    http://www.libreoffice.org/download/libreoffice-fresh/

    【讨论】:

    • 哦,好吧..但我认为这将是一个非常大的代码要我们自己编写..即使我上周有同样的任务,这就是为什么我给你这个......因为它来自命令行,我认为它也可以与 java 一起使用。如果您有兴趣尝试一下...
    • @NeelamSharma 非常正确:您可以在 Java 程序中调用 soffice.exe。
    • 你找到那个库了吗?我今天也遇到了同样的情况。我需要在我的 java 代码中而不是从命令行中执行此操作。当然,我可以从代码本身运行命令。但我正在寻找某种图书馆。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2017-08-25
    • 2014-04-04
    • 2011-02-27
    • 2014-03-12
    • 2014-11-06
    • 2021-09-11
    • 1970-01-01
    相关资源
    最近更新 更多